@@ -29,26 +29,42 @@
表現が異なる可能性がある物を置いとくなや、ちゃんと質を保証したうえでアップロードしろというお話ではあるのだが、半分はそもそも原文と翻訳の2つが全く同じ内容になることはあり得ない、ということを踏まえて書いている。
理系の論文であればそこまで大きく表現が変わることはないと思うのだが、私の場合人文系の論文も書くため、単語のチョイス一つにも結構気を使わなければならない場面はわりと多い。なので、日本語版の中には読んでもらえばわかるが英語のもともと書かれた単語を括弧書きで残していたり、場合によってはそのまんま載せてたりすることもある。これはもう半分の、編集校閲としての私の怠慢という部分も正直言ってある。
理系の論文であればそこまで大きく表現が変わることはないと思うのだが、私の場合人文系の論文も書くため、単語のチョイス一つにも結構気を使わなければならない場面はわりと多い。なので、日本語版の中には読んでもらえばわかるが英語のもともと書かれた単語を括弧書きで残していたり、場合によってはそのまんま載せてたりすることもある。
まあ、どうせ今公開している論文の内容を本気で読む 場合はどうせ英語版の方もそれなりに読み込んでくれるでしょう、、という甘えですね。
これはもう半分の、編集校閲としての私の怠慢。 まあ、どうせ今公開している論文の内容を本気で引用する 場合はどうせ英語版の方もそれなりに読み込んでくれるでしょう、、という甘えですね。この並列公開に私が本当にもっと時間を割くべきものだと価値を感じたらもうちょっと質が上がるかもしれん。
## そもそもの執筆の仕方について
じゃあ、なんでここ最近になって日本語版をセットで、かつ自分のWebで公開するようにしてるかという話に戻ると、そもそもここ最近英語現行の執筆のプロセスが少し変わったことに起因している。
大雑把に言うと、最近英語原稿を書くときは、日本語でドラフト執筆→DeepLやChatGPTで英語の下訳作る→気になるところを細かく修正、それ以降足りないと思ったところはゼロから英語で書き足す→再度ChatGPTなどで英文をざっと校正( 以前はGrammarlyも使ってたが、最近あまり使わなくなった) →editageなどの学術的論文校正サービスに出す、というような流れにな る。
大雑把に言うと、最近英語原稿を書くときは、こんな感じのプロセスをとってい る。
editageは最近生成AIで基本的な校正を行っている原稿に対して、安く校正を行ってくれるプランがあるのでそれを使っている。というか、editageでの校正は査読を通過した後にやることの方が多い。結局査読コメントでproofreadingした方がいいけど内容はいいので採択、みたいな感じなので、それでも採択されるなら、採択されるかわからん段階で数万円払うよりずっといいかと思うようになってきた。
- 日本語& Markdownでドラフト執筆
- DeepLやChatGPTで英語の下訳作る
- 気になるところを細かく修正( これは本当に1文単位で全部やる)
- pandocでtexに変換なりする( md→texの変換は図表やコードなどが上手くいかないため、以降の修正は両ファイルに加えることになる)
- それ以降足りないと思った部分は最初から英語で書く
- 再度ChatGPTなどで英文をざっと校正( 以前はGrammarlyも使ってたが、最近あまり使わなくなった)
- editageなどの学術的論文校正サービスに出す
ここで問題なのは、国際学会に論文を通すのに英語を覚える必要が無くなったとかいう話では全然ないということで。日本語で書いてると、「ここ英語で書くのめんどくさそうだけど、日本語で言うとこのニュアンス以外に当てはまるものがないんだよな」という場所はとりあえずそのまま書いて、英訳のタイミングで改めて考え直すという場合もあるし、日本語で書いているけど、「ここはどう考えてもこの英単語のニュアンスしかあてはまらなさそうなんだよな」と思ったら、ルー大柴状態になってもその英単語をそのまま埋め込んでしまうことがある。公開されている日本語版原稿に英単語がそのまま残っていたりするのは、そういう場所の名残である 。
editageは最近生成AIで基本的な校正を行っている原稿に対して、安く校正を行ってくれるプランがあるのでそれを使っている。というか、editageでの校正は査読を通過した後にやることの方が多い。結局査読コメントでproofreadingした方がいいけど内容はまあいいので採択、みたいな感じになるので、これで条件付き採択されるなら、採択されるかわからん段階で数万円払うよりずっといいかという方針 。
なので、オリジナルで書かれている日本語の原稿が100% 日本語で書かれているのか? と言われると、あくまであらかじめ英訳することを想定した日本語、ということになる。普通に英語で書かれたものを日本語翻訳して公開するのとは状況が違う。正直どちらを二次著作物と呼ぶべきかかなり微妙なところだ 。
ここで問題なのは、国際学会に論文を通すのに英語を覚える必要が無くなったとかいう話では全然ないということで。日本語で書いてると、「ここ英語で書くのめんどくさそうだけど、日本語で言うとこのニュアンス以外に当てはまるものがないんだよな」という場所はとりあえずそのまま書いて、英訳のタイミングで改めて考え直すという場合もあるし、日本語で書いているけど、「ここはどう考えてもこの英単語のニュアンスしかあてはまらなさそうなんだよな」と思ったら、ルー大柴状態になってもその英単語をそのまま埋め込んでしまうことがある。公開している日本語版原稿に英単語がそのまま残っていたりするのは、そういう場所の名残である。英語の原稿をAIで邦訳すると多分出てこない 。
なので、オリジナルで書かれている日本語の原稿が100% 日本語で書かれているのか? と言われると、あくまであらかじめ英訳することを想定した日本語、ということになる。普通に英語で書かれたものを日本語翻訳して公開するのとは状況が違う。どちらを二次著作物と呼ぶべきか正直微妙なところ。
## 論文ってどのくらい読まれてるのかな
## おれの 論文っていま誰に どのくらい読まれてるのかな
そういうわけで、英語の論文を投稿し終わったときには8割ぐらい完成状態の日本語原稿がすでにあるので、公開する手間が大したもんじゃない、かといって紀要に出したりするほどの手間を踏むよりWebにとりあえずぶん投げてしまった方が公益性が高そう、というのがより正確なモチベーションにな る。(自分の所属してる場所に紀要に相当する投稿機会がほぼないのもあるけど)
そういうわけで、英語の論文を投稿し終わったときには8割ぐらい完成状態の日本語Markdown 原稿がすでにあるので、公開する手間が大したもんじゃない、かといって紀要に出したりするほどの手間を踏むよりWebにとりあえずぶん投げてしまった方が公益性が高そう、というのが二言語公開の より正確なモチベーションであ る。(自分の所属してる場所に紀要に相当する投稿機会がほぼないのもあるけど)
何分、
何分、オープンアクセスとはいえ公開された英語の論文が( しかも大体PDFオンリー) どのくらい読まれてるかというと、あんまり届いてないだろうな、という実感もある。医学や化学系の論文よりは、ある程度一般の人も読むことで何らかの益を得られる可能性が高いだろうということもある。
あとは、ChatGPTとか生成AIがWebリソースをクロールして情報を引っ張ってこられるようになったことも大きな理由の1つ。Deep Researchとか試してみて思うけども、明らかにオープンアクセスになっているWebリソースの重要性がこれまでより上がってしまった。そして、生成AIはPDFでもほぼ問題なく読めているんだけど、プレーンテキストで読める状態のものが公開されていることのメリットも依然大きい。
( そもそも、多くの国際学会のTeXテンプレートはだいたいpdflatex前提で作られててUnicodeに一切対応してなくて、日本語の文献を引用することすらままならない状況とかにもイライラするわけですけども)
今後、そういう生成AIに何らかの認証情報渡して、雑誌購読してる人だけが生成AI経由でもアクセスできるようなインフラが出てくる可能性は十分あるなとは思うのだけど、当面この状況は続くように思える。
そして、結局読む人も生成AI使って訳しながら読むので、多言語で公開する意味は薄くなっているのかもしれない。とはいえ、先ほど書いたように執筆する段階で二言語並列して執筆してるので、「この部分機械翻訳したらニュアンス伝わらんやろな」という部分を、筆者側で両方の言語にオーサリングしている状態には価値がある‥と思う。