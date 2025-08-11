오마이뉴스의 모토는 '모든 시민은 기자다'입니다. 시민 개인의 일상을 소재로 한 '사는 이야기'도 뉴스로 싣고 있습니다. 당신의 살아가는 이야기가 오마이뉴스에 오면 뉴스가 됩니다. 당신의 이야기를 들려주세요.

AI에 대한 신뢰가 흔들린 사건

재미로 챗GPT의 독서 실력 테스트를 해봤습니다.

챗GPT는 책을 읽고 푸는 간단한 테스트에서 약 60%의 정답률을 기록했습니다

'책 속에 답이 다 있는데, 다 맞춰야 하는 것 아닌가?'

"급하게 기사 작성하느라 챗GPT가 찾아준 전문가 인용문 팩트 체크를 못하고 기사에 사용했는데, 나중에 교수도, 멘트도 다 거짓 정보로 밝혀져 난처했어요."

챗GPT가 독서에 약하다는 사실을 간단한 테스트를 통해 확인했습니다

AI(인공지능) 챗GPT에 대한 세상의 시선은 여전히 엇갈립니다. 누군가는 '대단한 혁신적 도구'라며 극찬하고, 또 다른 누군가는 '허위 정보의 장'이라고 경계합니다. 하지만 디지털 시대를 살아가는 우리는 이제 단순한 감탄이나 비판만으로 AI 기술을 대할 수 없습니다. 현 시점에서 챗GPT를 대하는 마음, 믿음과 의심 사이의 경계 정도가 아닐까 싶습니다.회사에서 챗GPT는 점점 중요한 역할을 차지하고 있습니다. 회의록, 통화 내용 정리나 방대한 자료 요약, 이메일 작성을 돕고, 보고 문서의 초안을 잡고, 아이디어를 확장할 때 유용합니다. 프롬프트를 어떻게 사용하느냐에 따라 결과물의 질이 크게 달라지는 걸 경험하면서, 챗GPT는 이제 복불복 검색창이 아닌 활용하기에 따라 삶의 질 향상 도구로 자리 잡고 있습니다.최근 'ChatGPT 활용 스킬'이라는 교육을 받았습니다. 하루짜리 교육이었지만, 단순한 지식 이상의 것을 얻었습니다. 그동안 제가 알던 AI의 세계는 빙산의 일각에 불과했습니다. 이 기술이 어떻게 쓰이는지, 어디까지 확장 가능한지 알게 되면서 앞으로는 이런 기술을 적절히 활용하는 능력이 강한 경쟁력이 되리라 믿어 의심치 않았습니다.단순 이미지 제작에서 영상, 영화, 광고물 제작까지 인공지능의 활용도는 무궁무진했습니다. 한 예로 파프리카는 AI서비스 '큐엘웍스'를 통해 리사이클링 패션 룩북 'Future Layer'를 제작해 '2025 도쿄AI 패션위크'에서 최종 우수작으로 선정됐다고 합니다. 이 밖에도 유튜브 영상 스크립트 추출, 논문 요약 프로그램, 엑셀 함수까지 능숙하게 다루고 개발자 역할도 해냈습니다. 짧은 시간에 챗GPT를 통해 뉴스 기사 스크랩 프로그램까지 뚝딱 만들었습니다. 교육을 받은 후부터 챗GPT에 대한 믿음이 점점 커졌습니다.하지만 최근 챗GPT를 색다르게 테스트할 기회가 생겼고, 놀라운 결과를 확인했습니다. 오히려 명확한 숫자 계산처럼 간단명료할 거라고 생각한 테스트에 예기치 못한 결과를 받고 깜짝 놀랐습니다.회사에서 매달 자율적으로 책이나 교육을 신청해 수강하고, 월말 시험에서 70점 이상을 받으면 교육비가 면제되는 제도가 있습니다. 독서를 생활화하고, 최신 도서도 접할 수 있어 매달 세 권의 책을 신청해 읽고 있습니다. 물론 시험 문제가 단순해 풀기 쉽습니다.지난 7월 세 권의 책을 신청했습니다. 성해나 작가의 <혼모노>는 소설이라 금세 읽고 시험에서 한 문제를 틀려 95점을 받았습니다. 두 번째로 읽기 시작한 유시민 작가의 <청춘의 독서>를 다 읽고 시험을 볼 때, 갑자기 챗GPT가 떠올랐습니다. '과연 시험 문제를 잘 풀 수 있을까?' 제 나름의 결론은 '당연히 100점을 맞겠지'였습니다.총 20문제인데, 제가 6문제만 풀고, 나머지 14문제를 챗GPT에 맡겼습니다. 100점을 기대했는데, 결과는 충격이었습니다. 정답률 57%. 14문제 중 6개를 틀려 간신히 커트라인 70점을 넘겨 위기를 모면했습니다. 20문제를 다 맡겼다면 챗GPT 덕분에 월급이 줄어들 뻔했습니다.혹시 <청춘의 독서>가 내용과 용어가 어렵고, 복잡한 구조라 그런 건가 싶어, 마지막 책 김금희 작가의 소설 <첫 여름, 완주>를 읽고 다시 테스트를 해봤습니다. 혹시 몰라 제가 10문제를 풀고, 나머지 10문제를 챗GPT에게 맡겼습니다. 정답률 60%. 책 한 권이라는 정해진 범위가 있고, 책의 내용도 문제도 어렵지 않았기 때문에 더 충격이었습니다.챗GPT가 책의 줄거리나 구조는 설명할 수 있을지 몰라도, 구체적인 내용이나 문맥 이해는 여전히 부족할 수 있다는 허점을 발견했습니다. 더욱이 문제를 풀면서 그럴듯한 설명까지 꼼꼼하게 덧붙였기에 왜 챗GPT를 두고 그럴듯한 오답 생성기라 했는지 이해할 수 있었습니다. 그동안 점점 커지기만 했던 챗GPT에 대한 신뢰가 흔들렸습니다.챗GPT는 천재 같아 보이지만, 프로세스를 보면 통계적으로 자연스러운 문장을 만들어내는 예측 모델일 뿐입니다. 가장 그럴듯한 문장을 뽑아내지만, 진실을 검증하지는 않습니다. 그저 온갖 사람들이 제공하는 정보를 모아 아주 그럴듯하게 사람을 흉내 내는 것이죠. 사람들은 너무 당당한 그 모습에 혹해, 가짜 정보나 존재하지 않는 사실을 믿는 경우가 적지 않습니다.실제로 <오마이뉴스> 한 시민기자에게 직접 들은 이야기입니다. 저 또한 글을 쓸 때 챗GPT가 제공한 허위 정보나 지어낸 전문가 인터뷰, 존재하지 않는 출처 등에 대한 팩트를 확인하느라 시간을 오래 할애하던 때가 있었습니다. 이러한 과정 때문에 글 쓰는 흐름이 끊긴 적도 많았죠.하지만 내외부에서 챗GPT 관련 교육을 받으면서 프롬프트의 중요성을 다시 한번 인지했습니다. 이후 제가 챗GPT에 요청하는 모든 정보에 '출처 명시', '근거(출처) 없는 자료 답변 금지' 전제를 깔았더니 이제는 출처가 있는 자료만 찾아주고 있습니다.해외에서는 더 심각한 사례가 많이 발생했습니다. 미국 <로이터> 통신에 따르면, 지난 6월 조지아 항소법원에서 AI가 생성한 두 개의 허위 판례에 기반한 하급 법원 명령을 파기했다고 했습니다. 해당 변호인은 이러한 사실을 인지하지 못했고, 항소심에서도 또 다른 허위 판례를 인용해 난처한 상황에 빠졌다고 보도했습니다.<가디언>에 게시된 기사에 따르면 시카고 선타임스는 여름 추천 도서 리스트에 실제로 존재하지 않는 책들을 포함한 콘텐츠가 AI에 의해 생성된 것임을 확인했다고 밝혔습니다. 추천 도서 외에도 전문가 인용문 역시 존재하지 않는 인물을 출처로 활용하는 등의 오류가 나타났다고 보도했습니다.이 모든 사례는 우리에게 문명 혜택의 위험성에 대해 다시금 생각할 기회를 주고 있습니다. 사람이 반드시 해야 할 일은, 챗GPT가 내어준 모든 것이 진실인지 검토하고 책임지는 진실의 필터 역할 아닐까요.챗GPT는 분명 인간에게 유용한 도구입니다. 단시간 내에 방대한 정보에 접근하고, 복잡한 생각을 정리하며, 창작의 단초를 마련해줍니다. 그러나 이 도구를 어떻게 사용하느냐에 따라 그 결과는 천차만별입니다.챗GPT 전성시대를 살아가는 현대인이, 믿음과 의심 사이에서 균형을 찾기 위해, 지금까지 챗GPT에 의존했다면, 앞으로는 챗GPT를 통제하고, 여기저기 산재한 의심을 거르는 역할을 해야 할 때입니다. 어쩌면 문명의 끝없는 발전에도 인간의 역할이 여전히 필요하다는 의미 있는 징조 아닐까요.그동안 많은 도움을 받던 챗GPT에 재미 삼아 시험해 본 테스트 때문에 문명의 편리함 뒤에 도사리는 위험성과 인간의 중요한 역할에 대해 고민하는 뜻깊은 기회를 얻었습니다. 더불어 인간의 비판적 사고와 책임감 없이는 인공지능 시대가 완성될 수 없다는 사실도.