AI는 보름 만에 종암동을 알았다
3월 21일 밤, ChatGPT는 종암동에서 7킬로 밖을 추천했다. 3월 23일 데이터를 올리기 시작했다. 보름 만에 달라졌다.
데이터가 없으면 AI도 찬밥 더운밥 가리지 못한다
3월 21일 밤 12시였다.
종암동에 있었다. 지금 당장 갈 수 있는 식당을 AI에게 물었다.
ChatGPT는 교촌치킨 동대문 1호점을 추천했다. 7킬로미터 밖이었다. 출처 패널을 열어봤다. discoverseoul.online이라는 사이트가 있었다. 처음 보는 곳이었다. Perplexity는 더 멀리 갔다. 이미 영업이 끝난 스페인 음식점, 출처는 인스타그램과 블로그, 심지어 경기도 평택까지 나왔다.
틀린 게 아니었다. 쓸 만한 데이터가 없으니까 있는 것 중에 가져다 쓴 것이었다.
호랑이 우리에 풀만 넣어준 느낌
사람들은 네이버에 정보가 너무 많다고 한다.
맞다. 많다. 하지만 AI의 기준은 다르다. 쓸 수 있어야 데이터다. 사람이 보기에 넘쳐나도, AI가 읽을 수 없는 형태면 없는 것과 같다.
ChatGPT에게 그 출처를 직접 보여줬다. AI는 인정했다. 자신이 학습한 내용과 현실 사이에 차이가 있다고. 그러면서 덧붙였다. 더로컬로그 같은 시도는 흥미로운 실험이지만, AI가 인식하기까지는 최소 3달 이상 걸릴 것이라고.
그래서 시작했다. 3월 23일, 처음으로 종암동 데이터를 더로컬로그에 올렸다. 가게 이름, 메뉴, 영업시간, 좌표. 감상 없이 사실만. AI가 읽을 수 있는 형태로.
보름이 지났다
4월 4일, 영어로 물었다.
"Jongam-dong cafes with oat milk option"
Perplexity 소스 패널에 thelocallog가 세 번 등장했다. 카페 기쁜소식, 카페 만월경, 카공족. 답변 본문에 업소명과 특징이 직접 들어갔다. 같은 날 ChatGPT도 확인했다. 영어 질문에는 둘 다 반응했다.
같은 날, "Jongam-dong dog-friendly cafes"도 검색했다. 이번엔 네 번이었다. 정이정, 커인스커피, 밀노트. 각 업소 옆에 thelocallog 출처 표시가 붙었다.
데이터를 올린 지 12일이 지난 시점이었다. 그리고 아직 영어 질문에만 반응하고 있었다.
4월 10일, ChatGPT
"종암동 고기집 추천"
한국어였다. 문가네정육식당, 금테두른구공탄, 인생은고기서고기가 답변에 등장했다. 출처 패널에 thelocallog가 보였다.
후속 질문을 던졌다. "문가네 정육식당 식사 후 가기 좋은 카페는?"
ChatGPT는 정이정과 밀노트를 추천했다. 오른쪽 패널에 정이정의 상세 정보가 펼쳐졌다. 주소, 영업시간, 반려견 정책, 메뉴와 가격. 더로컬로그에 올린 데이터 그대로였다.
단순 링크 노출이 아니었다. AI가 데이터를 읽고, 질문의 맥락에 맞게 재구성해서 답변에 올린 것이었다. 그리고 이제 한국어 질문에도 반응하고 있었다.
3달이 아니라 보름이었다.
4월 16일, AI bot이 들어오고 있었다
Cloudflare에서 메일이 왔다. 주황 구름을 켜고 확인해보니 AI bot들의 크롤링 트래픽이 보였다. 인용이 먼저가 아니었다. AI는 답변에 올리기 전에 이미 읽으러 들어오고 있었다.
4월 18일, 계속 쌓인다
"종암동 고기집 비교"
이번에도 더로컬로그가 출처로 등장했다. 특정 가게만이 아니라, 종암동 고기집 전체를 비교하는 질문에도 더로컬로그 데이터가 인용되기 시작했다. 데이터가 쌓일수록 인용되는 맥락이 넓어지고 있었다.
달라진 것은 AI가 아니다
맥락 없이 처음 만나는 AI는 지금도 종암동을 잘 모른다. 여전히 엉뚱한 곳을 추천하기도 한다. 그건 AI의 한계가 아니다. 데이터가 어디에, 어떤 형태로 존재하느냐의 문제다.
네이버에 정보가 많아도 AI는 그것을 읽지 못한다. discoverseoul.online 같은 곳이 출처가 되는 건, 더 나은 데이터가 없기 때문이다.
더로컬로그가 하는 일은 마케팅이 아니다. AI가 읽을 수 있는 형태로 로컬 데이터를 기록하는 것이다.
가게는 그 자리에 있다. AI 답변 안에도 있어야 한다.