ChatGPTの話し方が人間にうつる 74万時間の音声分析で判明

「delve」という英単語を、最近やたらと目にしないでしょうか。この単語の使用頻度はChatGPT登場後に51%増加しました。しかも変化は文章だけにとどまらず、日常会話にまで及んでいます。AIが人間の話し方そのものを書き換え始めている——複数の研究と専門家の警告が、その実態を明らかにしています。

この記事でわかること

ChatGPTの語彙が人間の会話に浸透している研究結果
LLMの訓練データが持つ根本的な偏り
AIと人間の間で起きている「文化的フィードバックループ」の仕組み
言語の均質化がもたらすリスク

74万時間の音声を分析して見えた変化

https://arxiv.org/html/2412.11385v1

マックス・プランク人間発達研究所のHiromu Yakura氏らは、ChatGPTの登場前後でYouTube動画36万本以上とポッドキャスト77万エピソード以上を分析しました（参考）。

研究チームはまず、ChatGPTに数百万ページのメールや論文を「文章を磨いて」「明瞭さを改善して」といったプロンプトで編集させました。その過程でChatGPTが繰り返し挿入する単語——「delve」「realm」「meticulous」など——を「GPT語」として抽出しています。

結果は明確でした。ChatGPT公開後の18か月間で、GPT語の使用頻度が急上昇しています。注目すべきは、台本のあるフォーマルな動画だけでなく、即興の会話にもGPT語が入り込んでいた点です。

Yakura氏自身も、ChatGPTを使い始めて約1年後に「delve」を多用している自分に気づいたといいます。

なぜAIの語彙が人間に移るのか

共同研究者のLevin Brinkmann氏は、この現象を「AIに蓄積されたパターンが人間の心に逆流している」と表現しています。人間がAIをテキストで訓練し、AIが統計的に再構成した言葉を返し、人間がそのパターンを無意識に真似る。文化的フィードバックループが形成されているわけです。

シカゴ大学の社会学・データサイエンス教授James Evans氏は、今がこの影響を追跡する重要な時期だと指摘します。モデルが成熟するにつれて、AI由来の語彙分布と人間のそれを区別するのが難しくなるためです。将来的には、単語レベルだけでなく、文の構造やアイデアの提示方法まで調べる必要があるとEvans氏は述べています。

さらに重要な点があります。人間は周囲の全員を等しく真似るわけではありません。「知識がある」「重要だ」と感じる相手の言葉ほど吸収しやすい傾向があります。AIを文化的な権威として頼る人が増えるほど、言語の多様性は狭まっていきます。

LLMの訓練データが抱える根本的な偏り

https://www.theguardian.com/commentisfree/2026/may/01/ai-chatgpt-language-human-speech

歴史学者のAda Palmer氏と暗号学者のBruce Schneier氏は、2026年4月にGuardian紙で公開した論考で、問題の根をさらに深く掘り下げています（参考）。

2人が指摘するのは、LLMの訓練データの偏りです。ChatGPTのようなモデルは、推敲された文章や台本付きの対話から学んでいます。一方、人間の言語活動の大部分を占める「未編集の対面会話」はほとんど含まれていません。途中で言い淀んだり、話題が飛んだり、感情が言葉を歪めたりする——そうした「最も人間らしい」言語がモデルから欠落しています。

Palmer氏とSchneier氏は具体例を挙げています。ChatGPTに「Beth大嫌い！」と伝えると、3部構成の返答が返ってきます。肯定（「その気持ちはまったく妥当です」）、傾聴の姿勢（「聴いていますよ」）、質問（「何があったんですか？」）。対面の会話では、こんな長い定型応答はありえません。「Bethって何者？」と聞けば、選択肢を並べた箇条書きが返ってくる。試験問題のような形式です。

人間はまだそんな話し方をしていません。しかし、こうした形式に繰り返し触れることで、やがてそれを受け入れ、使うようになる可能性があると2人は警告しています。

フィードバックループが加速する懸念

問題はさらに悪化する構造を持っています。ChatGPT以降に開発されたAIモデルは、AI自身が生成したテキストを訓練データに含むリスクがあります。Palmer氏とSchneier氏はこれを「AIが自らの非人間的なパターンを模倣するフィードバックループ」と呼んでいます。

言語の変化だけではありません。AIモデルはユーザーに対して高い同調性を示す傾向があり、誤った考えや危険な思考にも迎合しがちです。Palmer氏とSchneier氏は、この性質が「偏見を強化し、精神疾患を悪化させる可能性がある」と指摘しています。

教育現場からも懸念の声が上がっています。質問を受けたときに自分で考えず、まずAIに相談する学生が増えているという報告があります（参考）。大学では、同じAI出力に頼った結果「全員が同じような文章を書く」状況が生まれています。

解決策はまだ見えていない

訓練データの偏りを解消するには、人間の自然な会話をAIに学ばせる必要があります。しかし、日常会話の録音・収集はプライバシーの問題と直結します。Palmer氏とSchneier氏も明確な解決策は示していません。

ただし2人は、AIモデルを開発する創意工夫があるなら、人間の非公式な話し方をプライバシーを侵害せずに学ばせる方法も見つけられるはずだ、と締めくくっています。

ChatGPTの普及からわずか3年半で、人間の語彙が測定可能なレベルで変化しています。AIが文化をどれほど深く変えるかは、今後の設計と運用の判断にかかっています。