우선 우리는 AI가 생상해내는 데이터가 많아질수록, 즉, 대규모 생성 모델로 인한 향후 데이터 세트의 손상이 될 것임을 알아야 한다. 따라서 앞으로의 AI는 오히려 데이터의 진위판별에 더욱 많은 비용을 사용하게 될 것이다. 동영상 표절이 쉬워진다. 노아 AI : 유튜브 조회 수와 제목 등 관련 데이터를 모아 이용자들에게 인기가 많은 영상과 키워드를 추천해주는 프로그램이다. 즉, 표절 대상 검색에 사용될 수 있다. 클로바 AI(Naver) : 음성을 듣고 대본 추출이 가능하다. 뤼튼 : 비슷한 새로운 스크립트를 생성해준다. 이렇듯 광고 수익을 바라는 블로거나 유튜버들이 AI를 활용해서 표절을 감행하고 있다. 인터넷 생태계의 황폐화 이렇게 인공지능으로 가짜 데이터가 생성되면 될수록, 오리지널은 실종되고 인공..
ChatGPT란? Chat : 대화형 Generative : 생성하는. 그림, 동영상, 글 등 Pre-trained : 사전학습한 LLM(거대 언어 모델) 3천억개의 단어와 5조 개의 문서를 학습했다. 모든 LLM은 파운데이션 모델이다. 왜냐하면, 어느순간을 기점으로 느닷없이 나타내는 능력을 보여준다. (emergent). 따라서 사전학습하지 않은 것을 물어봐도 답할 수 있다. Transformer : 딥러닝 모델 주어진 문장들을 보고 다음 단어가 무엇일지를 확률로 예측한다. 이때 Attention Model을 사용하는데, 주어진 문장중에서 핵심 단어를 파악한다. 따라서 이 모델을 사용하면, 연산량을 높이면서도 정확성을 높일 수 있다. Transformer, Attention 모델도 구글이 오픈 소스로 ..