“구글이 우리를 바보로 만들고 있는가?” 애틀랜틱 잡지에 기고한 니콜라스 카의 글은 깊이 생각하지 않는 인간과 기억하려 하지 않는 인간을 적나라하게 고발했다. 많은 사람들이 검색엔진에서 찾은 정보를 일회용 플라스틱처럼 사용하고는 그냥 버려 버린다. 필요시 언제나 다시 검색 할 수 있는데, 굳이 칼로리를 소비하면서까지 자신의 뇌에 그 정보를 기억할 필요가 없다는 것이다. 창조의 신비인 우리의 뇌는 그렇게 버림받는 중이고, 우리가 버린 플라스틱은 이제 비와 함께 내린다고 과학저널 사이언스는 보도했다.
ChatGPT는 45 TB가 넘는 양의 웹 페이지, 책, 기사 등의 글을 가지고 학습되었다. 사람 한 명이 이만큼의 글을 읽으려면 최소 약 4천 번 정도 인생을 반복해야 한다고 한다. 이렇게 방대한 양을 가지고 학습되었기에 놀라운 성능을 보여주는 것이다. 이러한 점에서, 우리에게 여전히 매우 중요한 것은 아날로그 방식이든 디지털 방식이든 글을 써야 한다는 것이다. AI를 가능케 하는 핵심 동력 중의 하나는 글, 즉 데이터이기 때문이다. 인간의 글쓰기가 없었다면 지금의 ChatGPT는 없다. 문제는 인간의 글쓰기 능력은 이미 쇠퇴의 길을 걷고 있다는 것이다. 한 사례로 서울대 자연과학대 입학생 25%는 정규 글쓰기 과목을 수강하기가 어려울 정도로 글쓰기 능력이 부족했다. 미국과 호주 등 다른 나라도 비슷한 우려의 목소리를 냈다.
ChatGPT의 출현은 사실 문제를 더 복잡하게 만든다. 촘스키 같은 언어학자들은 어떤 형태이든 문법이 어느 정도 필요하다고 주장하는 반면, ChatGPT는 웹에 있는 인간의 글들, 즉 데이터만을 가지고 인간 언어를 학습했다. 그리고 그것을 바탕으로 글들을 ‘생성’한다 (‘창작’이 아닌 ‘생성’이라는 단어를 사용했음에 유의하자). 이렇게 생성된 글들은 인간들이 자신의 목적에 맞게 다시 웹에 게시할 것이고, 이렇게 웹에 게시된 글들은 다시 ChatGPT의 학습 데이터로 사용되어지는 반복을 거듭하게 될 것이다. 좀 과한 비유를 하자면, 먹었던 음식(데이터)을 소화하고 배설한 후(생성), 그 배설물을 다시 먹는 격이다. 이런 악순환을 피하려면, 기계가 생성한 글은 학습데이터에서 제외하고 인간의 창작 글을 학습 데이터로 사용해야한다. 문제는 주어진 글이 생성인지 창작인지 구분도 안 될 뿐더러, ChatGPT에 열광하는 우리는 순수 창작 글쓰기를 더 멀리 할 것이라는 점이다.
존 컬킨은 “우리는 도구를 만들고, 그 후에는 도구가 우리를 만든다”고 말했다. ChatGPT가 높은 품질의 답을 생성할 수 있도록 좋은 질문을 만드는 인간의 작업을 Prompt Engineering이라고 한다. 도구를 인간에 맞추는 것이 아니라, 인간이 도구에 맞춰지고 있는 격이다. 그리고 심지어 그것을 엔지니어링이라고 명명했다. 이는 몇 십 년 전에 검색엔진최적화(SEO)에서도 나타난 현상이다. 우리가 기계를 인간답게 만드는 동안, 인간은 점점 기계다워지고 있는 것이다. 배설물을 가지고 다시 학습한다면 ChatGPT의 성장도 언젠가는 멈출 것이다. 인간이 계속 기계다워진다면 말이다.