「新しい世界」に入る時の研究論文の選び方・読み方

別に研究者でなくとも論文を読まなければならないことはある。投資でも新しい理論を試したり、経済についての実証分析を読まなければならない事がある。機械学習の世界でも書籍になるのを待っていても、教科書としては良くても新しく情報を得る手段としては遅い。会計や法律などについても職業上議論の動向を追う必要があることも珍しくない。(注1)

最近、当サイトのもう一人の執筆者YOUKI氏が「投資を行う時は財務分析だけでなくマーケティングなど広範な知識が必要」という旨を指摘していた。まさしくその通りだと思ったが、逆に言えば投資を行う上で、未知の「新しい世界」に入っていくことが必要なときもある。

そんな時、まずは軽くネットで調べるだろうが、本格的に調べるなら書籍や論文にあたらなければならない。教科書としては書籍でも良いが、未知の分野であれば何から読めば良いかを決めるのはなかなか難しい。

そこで本稿では、投資に限らず「新しい世界」に参入する時にどのように文献を選んでいくかを決める手法を紹介したい。ここで紹介する方法は別に筆者オリジナルというわけではなく、似たようなやり方を採用している研究者は多い。故に、以下の方法はこれから論文を書こうとする学生さんなども使える手法である。

1. 論文を検索する

まずは調べたい分野について論文を検索することである。この時点では専門用語はあまり分からないかもしれないが、対象分野で知っている単語を並べると良い。

検索に使うのはGoogle ScholarSematntic Scholarが基本である。基本的に英語で検索することになるだろうが、日本語の論文も出てくる。また、どうしても日本の論文に絞る必要があればCiNiiも選択肢に入る。

ここではGoogle ScholarかSemantic Scholarを利用することを前提として話を進める。この2つが何が良いかと言えば、とにかく検索アルゴリズムが優秀であることだ。Semantic Scholarは検索技術を医薬品・サプリメントの相互作用を調べるためのサイトなども提供している。

関連記事:サプリメントと医薬品の相互作用を検索できるSUPP.AI

検索に引っかかったタイトルで興味深いものを選ぶだけでなく、Google Scholarなら「引用元」に示される被引用数、Semantic Scholarなら電球マークで示されるHighly Influential Citations(重要な引用数)や棒グラフマークで示されるCitation Velocity(引用数の推移)で論文の重要性が分かる。

勿論、内輪の研究者同士で引用数が上げられている論文もあるので、その意味ではSemantic ScholarのHighly Influential Citationsの数の方が信頼性は高い。

但しGoogle Scholarは論文だけでなく書籍など広く文献が対象となるので、文献の網羅性という意味ではこちらも優秀だ。関連記事などで似たテーマの論文を検索することもできるので、どちらにも良い点がある。

注1:最近は論文雑誌に掲載されるのを待つのも遅いので、プレプリントをarXivなどにアップロードして早く議論に載せるということも経済学や機械学習などでは珍しくない。

2.読む論文の候補を絞ってダウンロード

検索結果を参考に、調べたい分野で興味を持った論文を沢山選ぶことが重要だ。この時点では中身はあまり気にしなくて良いので、タイトルと引用数だけでとにかく沢山選ぶ。研究分野によっては難しいかもしれないが、20本以上を選べると良い。この段階では本当に読むかどうか分からないので、お金はかけずオープンアクセスが可能な論文(無料でウェブ上に公開されている論文)だけで良いと思われる。

Google Scholarなら論文のPDFのリンクが貼られているものは大抵は無料で読める。PDFリンクが無くても検索結果の先に飛べば(有料・無料を問わず)読む方法が示されていることが多いだろう。Semantic Scholarの場合、View PDFやView via Publisherというリンクで文献にアクセスできることが多い。

以上の方法を通じて論文を沢山ダウンロードできたら次に進める。

3.要約を読む

論文をピックアップできたら、それらの冒頭に書いている要約(Abstract)を読んでいく。要約だけで意味が分からなければ、導入部や結論部に書いてある要約を流し読みするのも良い。

この時点で調べたい分野と全然関係が無さそうなら、その論文はどんどん捨てれば良い。(どうせ無料である。)興味をもったものだけ残せば良い。5本を残すことを目標としよう。この時、4のために先行研究をまとめたサーベイ論文を1本くらい入れても良いかもしれない。

無関係なものを捨てた結果、5本を集まらなかった場合、検索ワードが悪かったということなので、もう一度1に戻ろう。この時点で要約に現れるような言い回しや用語などで検索ワードをどう工夫すれば良いかが見えてくるはずである。5本残るまで1~3を繰り返す。

4.先行研究の整理

5本ピックアップできたら、先行研究が書いてある部分を整理する。分野にもよるが、学術論文には既存の研究分野を整理している部分が多い。なぜかと言えば、既存の研究分野を整理し、その中でまだ未研究の部分を洗い出し、そこについて研究を進めるのが学術論文の「付加価値」であり、一般的な研究のお作法でもある。故に、最初の方に複数の文献を整理している部分は必ず存在する。

この時、3で指摘したサーベイ論文も有効である。サーベイ論文は、先行研究を整理し新たな論点や研究の展望を示すといったことが行われることが多く、新しい世界に入る上でも重要である。

こうした論文の先行研究を整理し、以下のことを整理する。

  • どういった観点で研究が進められているか
  • 何が分かっているか
  • どのような論文が引用されているか

研究に対するアプローチが分かれば補う必要のある知識も明確になってくるし、何が分かっているかを整理すれば知りたい分野との関連性もつかめてくる。先行研究を読んでいれば分野特有の専門用語もある程度把握することができる。

そして、どのような論文が挙げられているかというのも重要である。特に、選んだ5本の中で複数の論文から引用されている論文や書籍を探すことは重要である。調べたいテーマの分野において共通して引用されている文献があるならば、それはその分野での代表的な先行研究である可能性が高い。

この中には専門書も含まれているはずであり、それも是非読む文献リストに入れるべきだ。この時点でようやく「調べたい分野の代表的な書籍」が分かってくるのであり、書籍も3~5冊くらいピックアップできると良いだろう。

これは、いきなり最初にピックアップした論文を読んでも良いが、大抵は新たな分野に参入している場合、事前知識が少ないため、なかなか読み進められないことも多いからだ。

5.専門書を読む

その分野の教科書的なものを複数冊読んでいく。専門書を3~5冊を読むのは大変と思うかもしれないが、最初は知らない事が多く隅から隅まで読まないといけない。しかし、Google Scholarにも書いてあるニュートンの「巨人の肩の上に立つ」という言葉の通り、研究とは既存の膨大な先行研究の積み重ねの上に、少し新たな付加価値をつけるものである。

よって異なる書籍であっても、2冊目、3冊目となれば既知の内容部分が増えていき、未知の内容は少なくなってくる。最初は300ページで5,000円だったのが、「50ページで5,000円は割高だな」と思うようになれば、当該分野への基礎的な知識は十分である。

もっとも、分野によっては数学や統計の知識が必要となるかもしれない。社会科学系なら以下のような本で知識を補うのも良いだろう。

浦上昌則・脇田 貴文(2008)『 心理学・社会科学研究のための 調査系論文の読み方 』東京図書

6.ピックアップした論文を読む

ここまでくれば最初に選んだ5本の論文を読み進める力がついているのでどんどん読めば良い。また、当該分野について基礎的な知識が備わっているので、また新たに論文を探す場合も検索ワードに困らないだろう。

興味のある論文を読む前に本を何冊も読むような一連の方法は遠回りのように見える。しかし、「全く未知の研究分野のドアを開ける」ための方法としては結果的に効率的に進むことができると考えられる。

About HAL

金融・マーケティング分野の機械学習システム開発や導入支援が専門。SlofiAでは主に海外情勢に関する記事、金融工学や機械学習に関する記事を担当。

View all posts by HAL →