オランダのソフトウェアエンジニアMarkus Englund氏は、開発するツールを用いて、科学論文のオープンデータリポジトリにある600件のデータセット(Excel)のコピー&ペーストエラー等が疑われる箇所を検出しているが、なかには論文自体に修正が必要なものもあり、研究者と連絡をとって修正にたどり着いたものもある。

同氏が開発するツールは、GitHubに公開しているが商用では使えないものだが、Excelシート間で重複する行や列内の繰り返し配列の識別、研究の個体番号パターンの解析などの機能を実装しコピー&ペーストエラーの可能性を検出する。
論文といった学術研究のデータを取り扱うものだが、一般社会や個人レベルでは当然にもっとミスが多くなる。現在のように、アジャイルに動いている感のある世の中ではあればなおさら。

"あのシステムなら問題は起こらないだろう" "あの人の言うことなら間違いはないだろう" "あのAIなら間違いないだろう" という信頼性というメカニズムは効率的な枠組みだ。しかし、"あのシステムは絶対大丈夫" "あの人の言うことなら絶対間違いはない" "あのAIなら絶対間違いない" がよろしくない。
.
編集部おすすめ