PageRankで論文評価

昨日の信濃毎日新聞科学面で紹介されていた話題です。こまかい説明や引用元がなかったので、補足してみました。

学術論文を評価する指標のひとつに、他の論文から引用された回数(被引用数)というのがあります。多く引用された論文ほど高く評価されるわけですが、一方で、被引用数が少ないけれども重要な論文というのも少なからず存在します。そういうのをうまく見つけ出す試みとして、GooglePageRankの仕組みを応用してみたという研究です。
PageRankは、

「多くの良質なページからリンクされているページは、やはり良質なページである」

という考えに基づくものですが、それを論文の「引用」に応用しようというわけです。具体的には、1893年から2003年の間にPhysical Review各誌に載った論文の引用関係を調べ、引用を「リンク」とみなして、PageRankの方法を使ってランク値を計算しています。
その結果、PageRankのトップ10には、被引用数トップ10圏外から6本がランクイン。また、PageRankトップ100には、PageRankの順位が被引用数の順位の1/10以下(=10倍以上のランクアップ)の論文が22本現れています。
このように、被引用数よりもPageRankで著しい高評価を得た論文というのが少なからず出てきています。その中には、昨年ノーベル物理学賞を受賞したグラウバーの、業績の大本になった1963年の論文(被引用度では1193位→PageRankでは30位)のように、確かに価値の高いものも含まれています。
PageRankで逆に漏れてしまった論文というのがないのか気になるところですが、それについては記述がありませんでした。ともあれ、被引用度とは少し違った角度からの論文評価としては有望そうな感じがします。計量書誌学あたりの方による、さらなる研究が望まれます。
ただ、解説記事のほうで著者らは、この方法だけに頼らず、地道なブラウジングも必要だとも説いています。