第38期第33回研究会「メディア研究における量的テキスト分析の動向」(理論研究部会)【開催記録】

■日 時:2023年6月11日(日)16:00~18:00
■場 所:オンライン(参加登録が必要です。文末に登録用URLあり)
■報告者:于海春(北海道大学)
■討論者:渡辺耕平(早稲田大学)
■司 会:工藤文(早稲田大学)

■企画趣旨:
メディア研究は,メディア・テキストの分析を通して発展してきた。コンピューターの普及によってテキストの分析手法は飛躍的に発展し,その影響はメディア研究の領域においても無視できないものとなっている。学会誌である『メディア研究』(およびその前身である『マス・コミュニケーション研究』)において,量的テキスト分析の手法が用いられるようになっている。量的テキスト分析は大量のデータを分析できる利点を持ち,新聞記事のみならず,ソーシャル・メディア,テレビ番組,雑誌など,ありとあらゆるメディア・テキストが分析対象となる可能性がある。量的テキスト分析は,日本語のみならず韓国語や中国語といったアジア言語の分析にも対応しており,アジア言語に関心を持つ日本メディア学会の会員の関心とも合致するものである。

しかし,メディア研究に量的テキスト分析をいかに応用するか,実践例は多くない。また,量的テキスト分析を既存のメディア理論といかに接続するかについては課題が残るものの,近年では人の判断を含んだ分析も可能となっており,急速に発展する領域である。

そこで,研究会では、報告者として于海春会員に,量的テキスト分析の実践例を紹介いただく。于海春会員は博士論文に基づき,2023年3月に『中国のメディア統制―地域間の「不均等な自由」を生む政治と市場』(勁草書房)を刊行した。書籍では,中国の新聞22紙の2004年から2017年までを対象に,144435件という膨大なデータを用いて量的テキスト分析を行っている。于会員は,RのQuantedaパッケージのLSSを用いて,新聞記事を「番犬フレーム」と「宣伝フレーム」に分類し,中国の報道フレームの変化を導きだすことに成功している。特筆する点として,半教師あり学習の手法を用いて人間の判断を分析に含むことで,機械的に分類する従来の分析手法の限界を乗り越えている。研究会では,書籍第2章の,量的テキスト分析の成果を中心に報告いただく予定である。

討論者は,Quantedaパッケージの開発者の一人である,渡辺耕平氏にご登壇いただく。渡辺耕平氏は,英語・日本語の量的テキスト分析のみならず,韓国語や中国語を対象にしたテキスト分析にも洞察が深く,近年の多言語テキスト分析の動向をご紹介いただく。

本研究会を契機として,手法に対する理解を深めるとともに,理論的な接続の問題についても参加者と議論し,メディア研究における量的テキスト分析の可能性を検討したい。

【開催記録】

■記録作成者:工藤文

■参加者:68名(ZOOM使用)

本研究会は量的テキスト分析の実践例および手法の紹介を通じて,量的テキスト分析に対する理解を深めるとともに,メディア研究における量的テキスト分析の意義と可能性を検討した。報告者には于海春会員と討論者には渡辺耕平氏をお迎えし,人間の判断を分析に含むことができる半教師あり学習の手法と成果を報告いただいた。

于海春会員(北海道大学)は,『中国のメディア統制:地域間の「不均等な自由」を生む政治と市場』(勁草書房、2023年)の第2章に基づき,量的テキスト分析の実践例を報告した。まず,于会員は,中国のメディア統制を,北京・上海・広東ごとのメディア統制と自由の程度の差異に着目して分析する必要があるのではないかという問題提起を行った。この問題意識に基づき,2004年から2017年まで各地方の主要新聞紙の汚職や腐敗に関する記事144435件のテキストデータを用いて分析を行った結果を示した。分析には半教師あり学習であるLSS(Latent Semantic Scaling)を用いて,新聞記事を「番犬フレーム」と「宣伝フレーム」に分類し,中国の報道フレームの変化を導きだした(分析にはRのLSXパッケージを利用した)。この上で,地方ごとに用いるフレームには差異があることを示した。研究会では,LSSを用いた理由と,「宣伝」「番犬」フレームの抽出方法に用いた「種語」の選定方法について説明が行われた。また,書籍には含まれなかった2018年以降のテキストデータを用いた研究結果についても報告がなされた。分析の結果,習近平政権発足以降により新聞が「宣伝フレーム」を用いるようになったことを実証的に示した。于会員の研究は,これまで実証的に論じられてこなかったメディア統制の地域的差異を,量的テキスト分析と重回帰分析を用いて実証し,メディア研究に新たな手法の可能性を提示している。

渡辺耕平氏(早稲田大学)は,LSSの開発に至った背景や,アジア言語を対象にした分析の重要性について討論を行った。LSSの開発に至った背景には,メディア研究における主要なテーマであるバイアスをいかに抽出するかという問題があった。そこで,渡辺氏はロシアの新聞テキストのバイアスを抽出するために,半教師あり学習に着目した。渡辺氏はLSSの手法を用いて感情スコア(ポジティブ/ネガティブ)を記事に付与することで,長期的な記事の論調変化を実証することに成功した。続いて,LSSによるアジア言語の分析の重要性について説明を行った。渡辺氏は量的テキスト研究が,テキストデータが入手しやすく分析手法が確立している英語を対象にした欧米中心になっているという問題点を述べた。また,アジア言語はスペースで単語ごとに区切りがない場合が多く,アジア言語を対象にした分析の難しさについても説明がなされた。しかし,アジア言語に対する量的テキスト分析は,中国語・韓国語・アラビア語などで研究成果が公表されており,発展が著しい領域となっている。実際のアジア言語の分析例として,渡辺氏が行った日本とイスラエル(ヘブライ語)の保守系新聞に対する分析の結果を示しながら,各国の政権と保守系新聞の論調の関係を論じた。渡辺氏の討論では,半教師あり学習の利点や分析メカニズムの詳細な説明がなされ,手法に対する理解を深めるとともに,アジア言語を対象に分析することの重要性について認識することができた。

フロアからの質問は,手法に対する質問に集中した。まず,種語が適切に選択できているかをいかに評価するか,という質問があった。渡辺氏からは今後種語の選択を評価するための手続きを検討している旨の回答があった。また,分析において最も苦労した点は何か,という質問に対しては,于会員から記事データのクリーニングという回答があり,テキストデータ分析における苦労がうかがえた。言葉を分割する分かち書きについての専門的な質問と,渡辺氏の応答もあり,計量テキスト分析の仕組みに対する理解を深めることができた。

本研究会は,60名を超える参加者があり,メディア研究における量的テキスト分析の関心の高さを表していると言えよう。半教師あり学習の手法は,人間の判断を含むことができるため,メディア学会の会員が用いる内容分析などの手法とも関連性を持つと言える。本研究会が,メディア研究における理論と手法を結び付ける議論のきっかけになれば幸いである。