レビュー

レポートがコピペかどうか判定できる「剽窃チェッカー」デスクトップ版、Word・PDFなど複数ファイル比較が可能


2013年11月に公開されたコピペ判定サイト「剽窃チェッカー」は、サイト上の入力フォームに文章を入れると、それがコピペかどうか検索を行ってチェックしてくれるというもの。そのデスクトップ版が公開されましたが、こちらはWord文書やPDFファイルを読み込ませて比較できる機能が実装されています。

【無料】デスクトップ版剽窃チェッカー:コピペの有無をファイル単位でチェックします
http://plagiarism.strud.net/desktop.html


デスクトップ版を利用するためには、まずページ中程にある「ダウンロード」の項の「こちらのページ」というリンクをクリックし……


ダウンロードページにある「HC_desktop.lzh」「HC_desktop.zip」のいずれかをダウンロードします。中身は同じものです。


ダウンロードしたファイルをExplzhなどのソフトで解凍します。


フォルダの中身はこんな感じ。「HyousetsuChecker.exe」が本体なので起動させてみると……


お知らせ画面が表示されたので、「実行モード」をクリック。


まずは単体のファイルについて、Web検索を使って剽窃かどうかをチェックしてみます。チェック用に使う論文は中本哲史氏の論文「(PDFファイル)ビットコイン:P2P 電子マネーシステム」です。


論文の後半「11. 計算」の項目に、以下のようなテキストがあります。

攻撃者が正当なチェーンよりも速いスピードで偽のチェーンを作成しようとするシナリオを考えてみる。仮にそれに成功したとしても、コ
インを無から創り出したり攻撃者自身が所有したことのないコインを盗んだりというようにシステムを自由に操れるようになるわけではな
い。ノードは無効な取引を用いた支払いも無効な取引を含んだブロックも拒絶するからである。攻撃者にできるのは自身の取引記録を書
き換えることで、最近支払った金額を取り返そうとすることだけである。

ここに読点をいくつか挿入し、語尾も丁寧語に変えたものをサンプルとして用意、テキストファイルに保存します。

攻撃者が、正当なチェーンよりも速いスピードで偽のチェーンを作成しようとするシナリオを考えてみます。
仮にそれに成功したとしても、コインを無から創り出したり、攻撃者自身が所有したことのないコインを盗んだりというように、システムを自由に操れるようになるわけではありません。
ノードは、無効な取引を用いた支払いも、無効な取引を含んだブロックも、拒絶するからです。
攻撃者にできるのは、自身の取引記録を書き換えることで、最近支払った金額を取り返そうとすることだけです。

剽窃のチェックを行うため、「ファイルを開く」をクリックし……


チェックしたいファイル、今回の場合は「新しいテキスト ドキュメント」を選択し、「開く」をクリック。


ファイルが一覧に追加されたのを確認後、モード欄を「Webを検索」にして、「実行」をクリック。


チェックが終わるとこのようにブラウザ上に結果が表示されます。今回の場合、一致率が70%と高く、剽窃であろうということで枠の背景が赤くなっています。細かい分析結果を見るには「分析結果へのリンク」欄のファイル名をクリック。


すると、それぞれの行について剽窃かどうかチェックした結果が見られます。「攻撃者が」「ノードは」の2行は短すぎて対象から除外され、1行は汎用的な表現だとして省かれています。残る10行のうち、3行は語尾を変えているので検索にヒットしませんでしたが、残りがヒットしたため剽窃だと判断されました。


具体的に、ヒット件数の少なかった「攻撃者にできるのは」というフレーズの検索結果を見てみると、1件目に元の論文が表示されていて、他の結果もこの論文の引用でした。


同じように、複数のファイルでコピペが行われていないかどうかをチェックする「ファイル間比較」がデスクトップ版独自の新機能。このようにファイルを複数選択し、「ファイル間比較」モードを選び、ファイルの文字コードを選んで「実行」をクリックすると……


それぞれのファイルで重複している部分を探し出してくれます。今回は論文の「概要」部分を丸コピーしたレポートを3人が出してきた、というわけです。


なお、読点の位置を変えたり語尾を変えたりしてオリジナルとは別の文章だと解釈されるようになると、重複は0になります。くれぐれも悪用は厳禁です。


ちなみに設定項目はこんな感じ。


デスクトップ版で分析可能なファイルはWord文書(.doc・.docx)、PDFファイル(.pdf)、OpenDocumentテキスト(.odt)、一太郎文書(.jtd)、HTMLファイル(.html)、テキストファイル(.txt)。チェッカーに同梱されているxdoc2txtがテキスト部分を抽出してくれるので、Wordや一太郎など、作成元のソフトをインストールしていなくてもチェック可能です。

この記事のタイトルとURLをコピーする

・関連記事
STAP細胞論文が論文の査読に代わる新システム「Open Review」の事例に登場 - GIGAZINE

画像の捏造を見抜くソフトウェア「LP-exam」が不正を検出している仕組みはこんな感じ - GIGAZINE

ナタリー・ポートマンは「5」、理系ならほぼみんな持っているかもしれない「エルデシュ数」とは? - GIGAZINE

in レビュー,   ソフトウェア, Posted by logc_nt

You can read the machine translated English article "Plagiarism checker" which can judge whe….