今回はPR記事になります。
紹介させて頂くのは株式会社 Next LabのReadableというサービスです。Next Lab社よりReadbleの提供を受け、筆者が実際にサービスを利用した上で記事を作成していることを付記しておきます。
Readableとは?
さて、突然ですが、皆さんは普段、どのくらいの頻度で英語論文を読んでらっしゃいますか?このブログを読んでくださっている方々は医師の方が多いと思われますので、一般の方と比較すると英語力が高く、日常的に英語論文を読んでいる人も少なくないのではないかと推察します。そんな中で大変恐縮なのですが、実は管理人は英語がめっぽう苦手です…。入学時のTOEICで酷い点数を取ってしまい、一番ランクの低いクラスに配属されましたし、臨床実習で指導教官から渡される英語論文が嫌で嫌でたまりませんでした。それでも、最近になって少しずつ英語学習に取り組んではいるのですが、こんな調子ですから英語論文を英語のままで読むことはほとんどありません。大抵は翻訳ツールを使用して読んでいます。
最近では、Google翻訳やDeepLなど、翻訳ツールの精度が向上し、Webサイト上の英文は違和感のないレベルで日本語に翻訳されるようになってきました。また、ChatGPTをはじめとする生成AIは、より柔軟で創造的な翻訳ができ、文脈を考慮した翻訳も可能です。このため、英語が苦手な人でも英語論文などの英語資料に手を伸ばしやすい環境になってきたと言えるでしょう。
そのような中で、PDFファイルで作成された英語資料については取り扱いが難しく、先述したツールを使っても上手く翻訳できないことが多いです。例えば、表やグラフのレイアウトが崩れてしまったり、全ての文章を翻訳してくれなかったりして、イライラした経験のある方もいらっしゃるのではないでしょうか。
今回紹介するReadableは、株式会社 Next Labが開発した翻訳ツールです。PDFファイルをアップロードするだけで、30秒程で翻訳されたファイルが完成します。ファイルは翻訳前と翻訳後のファイルを並べて出力することができ、翻訳に違和感がある部分についてはすぐに見比べることができます。翻訳には独自の翻訳エンジンを使用しており、DeepLやChatGPTなど、外部のコンテンツに依存しておらず、他のサービスと比較すると安価な価格設定が実現されています(ただし、無料版に限ってはDeepLを使用しています)。価格は月間契約では980円/月、年間契約では9,800円/年となっています。
Readableを実際に使ってみた!
当然ながら、本記事を作成するにあたり、私自身もReadableを使用してみました。実際の翻訳ファイルも一部お見せしつつ、使用感を述べていこうと思います。今回は、“The Associations between Insomnia Severity and Health Outcomes in the United States”という、オープンアクセスの論文1)を使ってデモを行っていきます。
まず、Readableのwebサイトに翻訳したいPDFファイルをアップロードします。
画面はこのようになっており、ファイルのドラック&ドロップ、または直接ファイルを選択することで簡単にアップロードできます。
今回くらいの大きさのファイルであれば、10秒ほどで翻訳ファイルが完成します。
翻訳ファイルとしては、日英交互に表示されたPDFと日本語翻訳のみのPDFのいずれかを選択しダウンロードできます。見比べるという意味では、より視認性の高い、日英交互に表示されたPDFがおすすめです。
以下が日英交互に表示されたPDFの1ページ目です。
レイアウトを保ったまま翻訳されていますし、翻訳された日本語も自然です。著者や所属組織など、細かい部分は翻訳されず英語表記のままとなっています。
次に、グラフのあるページの翻訳ファイルです。
こちらもレイアウトはそのまま保たれています。ただ、このページでは日本語が一部重なって表示されていますし、英単語が残っている部分も散見されます。こういった細かい部分は本文と比較して補っていくしかなさそうです。
このように、Readableは直感的に使用でき、難しい操作は全く含まれていません。翻訳ファイルも、確かに日本語も自然でレイアウトも保たれていますし、完成までの時間も短いです。実際に使用してみて、PDFファイルで英語論文を読むことが多い方には大変有用なツールだと感じました。
Readableを使用する上での注意点
ここまでReadableの使い方とその強みを中心に解説してきました。この項目では、打って変わって私がReadableを使用した上で少々残念に思ったポイントについて触れていきます。
すべてのPDFファイルを翻訳できるわけではない
個人的に、一番注意すべき点はここだと思っています。
PDFファイルには文書を作成した時のテキストがデータとして含まれていることが多いのですが、中にはテキストデータが存在しないファイルもあります。例えば、スキャンして取り込んだファイルなどが該当し、単に画像をPDF化したような形になっています。こういったファイルのテキストはReadable内で処理ができないため、翻訳することができません。ただ、スキャンされた文書をPDF化する際、OCR(光学文字認識)技術を使うことでテキストをデータに変換することが可能であり、このような工夫をすれば翻訳も可能です。
一方、特殊な加工でテキストデータを認識しにくくしているファイルもあり、この場合はどう調整しても翻訳が難しいです。また、アップロードできるファイルの上限が100ページ以下かつ50MB以下となっており、これを超える場合にはファイルを分割する必要があります。実例を挙げますと、COPDの国際ガイドラインであるGOLD report2)はReadableを使ってもうまく翻訳できませんでした。このGOLD reportはPDFで無料公開されているのですが、冊子版が販売されていることもあってか、すべてのページに“COPYRIGHT MATERIAL-DO NOT DISTRIBUTE”という透過処理を施されたテキストが斜めに挿入されています。このテキストをデータとして認識してしまうため、本文の翻訳がおかしなことになってしまいます。また、ページ数も200ページ以上あるため、ファイルの分割が必要となります。色々調べながら、やっとの思いでファイルを分割したわけですが、最終的に翻訳に失敗してしまい、流石に心が折られました…。そんなわけで、このGOLD reportについてはおとなしく英語のまま読みました。
webページに本文があればGoogle翻訳で対応可能なのですが、海外のガイドラインはGOLD reportのようにPDFしか利用できないことがあります。このような状況でReadableが使用できると大変便利なのですが、上記のような問題から翻訳できない可能性があることは折り込んでおいた方がよいでしょう。
日本語に翻訳されず、英語のまま残ってしまう部分がある
「Readableを実際に使ってみた!」の部分でも触れましたが、一部翻訳しきれず英語のままになってしまっている箇所が散見されます。こちらもテキストデータとして認識されていないことが原因と考えられますが、数は多くないため、その部分だけ普通に英語として読めば問題ありません。ただ、「俺は完全に英語なしで論文を読みたいんだ!!」という人にはストレスになる可能性があります。
なお、レイアウトが崩れたり、日本語が一部重なっている場合は、原因の調査や修正が可能なこともあるため、一度カスタマーサポートまでお問い合わせください。
まとめ
以上、Readableについて紹介をしてきました。結論を申しますと、私はPDFで英語論文を読むことが多い方には十分活用に値するサービスだと考えます。ただし、その仕組み・欠点も知ったうえで運用するのがよいでしょう。
本記事の読者特典として、1か月+1週間の専用クーポンコードを利用できます。クーポンコードは「fushikian」です。以下にReadableのリンクを貼っておきますので、本記事を読んで興味を持った方は是非試して頂ければと思います。
一応利益相反はありますが、私の感想をストレートに書いたつもりです。参考になりますと幸いです。
参考
1)J Clin Med. 2023 Mar 22;12(6):2438.
2)2024 GOLD report