おじさん構文とは?

 

「おじさん構文」とは何だろうか。カタカナを多く使用、句読点、絵文字、そして長い文、といった特徴がある。「おじさん構文」は謎めいている。それは主に中年の男性に関連した文化現象でこの「おじさんたち」は、若者達に対して特別な方法でメッセージを送ることもある。これにはいくつかの理由があるようだが、一般的に若者とつながるために使っていると言われている。それが恋愛的なものこともあれば、部下ともっとうまく繋がりたいということもあるだろう。これはクールに見せる方法であり、冗談を交えて誰かを誘う方法でもある。拒絶された場合でも、必死に見えないようにするためでもある。絵文字とカタカナは「おしゃれ」とか「新しい」とか認識されており、特に彼らが若い頃にはそうだったようだ。この「おじさん構文」はその影響かもしれない。私たちは、おじさん構文の歴史をレポートするのではなく、おじさん構文を使う時、どんな意味を伝えるのだろうかという質問に答えるつもりだ。    

 

この珍しいトピックを選んだ理由

おじさん構文例この作文のトピックを選んだ理由として、まず、おじさん構文というのは現代日本文化の面白いポイントの一つだということがある。アメリカの文化に相当な言語スタイルがない上、実は英語で「おじさん」は一つの言葉ではない。家族の人だったら「uncle」をいうが、家族じゃないおじさんだったらよく人の名前を言う。英語でおじさんのような曖昧な言葉がないから、多分おじさんと言う意識もない。それから、「おじさん」まで翻訳しにくいため、AIは私たちの選んだ記事を上手く翻訳できないかもしれない。その上、おじさん構文の特徴は絵文字や、句読点で、ひらがなの代わりにカタカナを使う場合もある。この三つは、AIの苦手なポイントのようだから、翻訳においていいチャレンジじゃないだろうか。

でもこのトピックはAIにチャレンジするためだけではなく、本当に大切な問題について考えることもできると思う。おじさん構文というのは日本語を勉強している外国人が日常生活に見る複雑な日本文化のひとつかもしれない。日本語ネイティブじゃない人はこのようなトピックを見たり聞いたりしたら、インターネットで調べてブログやツイートなどを読むかもしれない。よく分からなかったら、AI翻訳サービスに入れると思う。だから、私たちは翻訳しにくい文化的なトピックについてのブログをAIに入れてみたかった。AIは上手く大衆文化の記事を翻訳できるか、思い違いを作るのか、人々がこのAIツールを使わない方がいいのかを知りたい。

 

グーグルやDeepLというAIプログラム

 

さらに、使いやすくて、多くの人が使っているAI翻訳サービスを検討したかった。だからグーグルの翻訳ツール(グーグル)とDeepLを選んだ。グーグルは世界中で一番使われている翻訳AIだ。写真の翻訳ができるし、漢字が書けるツールもある。それで、DeepLは特に日本語を勉強している人たちに人気があるそうだ。両方ともサイトとアプリがあるし、使いやすい。しかし、新しい翻訳AIは多くの人がまだ使っていない。、特に年齢が高い世代は使っていない。例えば、ChatGPTとClaudeはもう少し当たっている翻訳AIですが、グーグルみたいに写真やイメージに入っている言葉を翻訳できない。その上、グーグルとDeepLみたいに翻訳を声に出して読み上げない。

AIは素晴らしいツールだけどこのプロジェクトは、AI翻訳サイトを使いながら気をつけなければならないメッセージを伝えるのが目的だ。日本語を勉強している人に、AIの失敗の例を表して、特に文化的なトピックについての記事とか、句読点と絵文字が多いテキストが苦手なポイントを強調できればいいと思う。

 

翻訳したオンライン記事の紹介

 

翻訳してみたい記事はオンライン作品で、ケータイWatchという技術のサイトで探した。このサイトの聴衆はテクノロジー系が好きな若者だと思う。この記事はおじさん構文について調査の結果を表して、おじさん構文を使う人を少しだけバカにしてるので、記事の聴衆はおじさんじではない人だろう。アンケートされた人は10歳から24歳までの男女600人ぐらいだった。このアンケートの結果から、10位までのおじさん構文っぽい特徴を説明する記事だ。この中に色々な文章、書くスタイル、スラングなどがあって、翻訳するのは面白いだろうと思った。左の画像は10位までの特徴の要約である。

 

民間調査の結果の翻訳

 

この二つの例は「第2位 文章中にカタカナを乱用」から取り上げた。おじさんのカタカナの使い方は面白くて、調査された人からのコメントが入っていたので、その色々な雰囲気を翻訳してみたかった。

この例はすごく面白いと思う。日本語の文章で「ってんのよ」というのはユニークな雰囲気を作るけど、グーグルの翻訳も、DeepLの翻訳もこの雰囲気を翻訳できなかった。グーグルの翻訳はすごく変になってしまった。句読点は3個で、種類は二つだ。それで意味は全然違う。なぜ質問になったのか分からないが、多分グーグルはそのちょっと珍しいエンディング「ってんのよ」の意味が質問だと思ったのかもしれない。DeepLの翻訳は大体合ってるが、書いた人の個人的な書き方を英語では書けなかった。

私たちだったら、“yeah, my dad uses it” に翻訳したいと思う。なぜかというと、「使ってんのよ」という表現はカジュアルに答える時に使う表現だ。「father」と比べると「dad」の方が自然かもしれない。また、英語は低コンテキスト言語だから、「お父さん」は「my dad」に翻訳した。「My」という主語がなくて「yeah, dad uses it」になると、読む人と書いた人は同じお父さんがいるらしくなってしまう。人が翻訳する時、意味も文法表現の感じも守らなければならないので私たちはこの二つのポイントにフォーカスしたんだ。

「おじさん」の翻訳しにくさ

 

二つ目の例は私達の興味があるポイントを表す。つまり、英語でおじさんという言葉がないことだ。三つ、四つぐらいの英語の言葉は日本語でおじさんになるかもしれない。「おじさん」を翻訳したかったら、文脈に気を付けなければいけない。日本語はハイコンテクスト言語だから、AIを入れると文脈を見つけることができない場合もあるのだろう。

DeepLは「uncle」と書いた。その翻訳は普通だと思うが、この文章の中では、「middle-aged men」か「Generation X」のほうがわかりやすいかもしれない。なぜかというと、多くの言語と違って、英語で「uncle」という言葉は家族だけで使うからだ。みんなのおじさんは同じ年じゃないので、「uncle generation」という言い方は意味がない。でもグーグルは「old man」と書いた。これには少しおどろいた。おじさんは英語で一つの言葉ではないが、あり得る言葉のリストで「old man」は絶対に現れない。どうしておじさんはold manになってしまったのか興味がある。

実は、自分でこの文書を翻訳することは大変だった。「おじさん世代」も「カタカナ語尾」も翻訳するために多くの文化的な情報は必要だと思う。まず、「おじさん構文」を翻訳した。AIの「old man’s generation」と「uncle generation」の代わりに、英語ネイティブがよく知ってるはず「Generation X」に翻訳したいと思って、おじさんは男性だけだから「the men of」を上げたんだ。次に「カタカナ語尾」のところを翻訳した。その部分は日本語の文法と関係あるので翻訳しにくかった。文字通り翻訳だったら、多分AIが言った通りに「katakana endings」だろう。しかし、英語ネイティブはその翻訳の意味が分からないかもしれない。だから、私たちは文書のストラクチャーを変わって、もうちょっと文脈を上げて、「using katakana characters to end sentences」にした。イタリックにした理由は、よく英語文学で他の言語の言葉はイタリックで書くので、人々はイタリックを見ると外国語のコンセプトをすぐに分かる。AIは他の文脈と情報を使いながら翻訳することできないので、この記事の部分を上手く翻訳できなかったのではないでしょうか。この例で、翻訳をする時、人しかできないことがまだあることをよく見られると思う。

 

「ww」のような若者言葉

 

この二つの例は「第1位 絵文字・顔文字・記号を多用」からだ。おじさん構文は多くの絵文字を使う特徴もある。「おじさん」と呼ばれていない人の思い出を見てみたかったし、この例はスラングを使っているので、翻訳AIがこれを理解できる可能性があるのか試してみたかった。

この例はAIで翻訳することはちょっと難しいようだった。しかし、グーグルの翻訳はよくできたと思う。でも、グーグルとDeepLでAIの違いがあるということが分かった。どちらかのAI翻訳サイトは、より良い翻訳をすることがあるみたいだ。DeepLは「ww」を名詞にして「おじさん」はどこにもない。おじさん構文の書き方はSNSの話し方なので、普通に使っている「ww」を翻訳できないことは、DeepLはおじさん構文を翻訳しにくい可能性が高いかもしれない。そうは言っても、グーグルも「I」は名詞になっているので、AIは名詞の文脈がなかったら翻訳がミスしてしまうことが多いようだ。

これは私達の翻訳だ。三つのポイントは「今どき」と「ww」と誰が頑張っている。「今どき」はそのまま翻訳したら「Now times」になるとか「modern times」になるのが、一番ナチュラルの気持ちは「the times」だと思う。それで、グーグルと一緒に「ww」は「笑う」のカジュアルのことだったので、「haha」のカジュアルのことは「lol」だと思う。それで、最後のことはその頑張っている人達は誰だろうか。語っている人は「おじさん構文を使っているおじさんたち」について話しているので、その頑張っている人達は「おじさん」たちだった。でもその文脈で考えていたら、「they’re」は多分一番ナチュラルだと思う。

 

Galaga Keiとは?カタカナ語の翻訳の難しさ

 

この例はとても面白いと思う。なぜなら、よく使われているカタカナの単語が使われているのに、DeepLは正しく翻訳できないからだ。おじさん構文の特徴の一つは普通はカタカナを使わないところに使うことだ。もしAIがこのカタカナの単語を理解できないなら、もっと砕けた言葉が使われるSNSや、奇妙な方法で使われるカタカナ語を理解するのは難しいかもしれない。Googleもこの文の文法に苦労し、「remains」という表現を使用した。これでは、壊れているガラケーとかガラケーの死体のせいだと思われるような意味になってしまうだろう。

ちょっとだけ長くなちゃったのが、この方は英語でもっとわかりやすいと私たちが思った。「ガラケー」は「flip phone」ので、そのままで大丈夫だと思う。だけど「名残」は翻訳するのがもうちょっと難しい。この「名残」は「leftover habits」に翻訳した。「名残」の文脈は「おじさんたち」はガラケーを使っていたんで、ガラケーで絵文字とか顔文字を使ったらいいイメージをなる。それで、そのいいイメージは今まで伝えたいので、おじさんは絵文字と顔文字を使う癖になっちゃった。

 

実際のおじさん構文を翻訳しよう!

 

この記事の中に「おじさん構文ジェネレーター」というサイトを紹介している。すぐに私たちは興味を持ち、使ってみた。下のスクリーンショットにあるが、ここにもメッセージの作り方を説明しておく。最初に、誰かの名前を入れる。次に、絵文字レベルと句読点レベルを選ぶ。最後に「生成」ボタンを押したら、おじさん構文スタイルのテキストが出るはずだ。

この素晴らしい、革新的なAIサービスを使うと、他のAIに入れて翻訳してみたくなった。日本語ネイティブじゃない人たちが、このようなメッセージをもらえば、多分グーグルやDeepLで翻訳してもらうだろう。それで、この場合をシミュレーションしてみた。あきこという一般的な日本人の名前を使い、下のメッセージが出た。

このおじさん構文ジェネレーターはたくさん絵文字と顔文字を使っているし、変な句読点の使い方もある。最後のところにカタカナも使われている。グーグルでは、「おじさん」のお弁当は「your」弁当になってしまった。「あきこちゃん」の弁当を食べて、「Akikoーchan’s things were also eaten」を書いているので、もう一度「あきこちゃん」の弁当を食べていたという意味になってしまっている。DeepLの「I had a delicious onigiri for lunch」は大体当たっているのが、DeepLにも「あきこちゃん」の弁当は「おじさん」が食べた意味になっている。両方の翻訳は日本語のテキストからの卑猥な意味がなくなってしまった。どちらかというと、、グーグルの方が卑猥な意味になっている。「Akiko’s things」は英語でちょっと卑猥っぽくと見える可能性があるが、日本語では「お弁当を食べながら卑猥なことをしたかった」ということ違って、グーグルでは「お弁当を食べながら卑猥なことをした」の意味になってしまった。その上、両方は「イヤ〜ナンチャッテ」を翻訳できなかった。

私たちだったらこのような翻訳をすると思う。「ちゃん」の同じ意味がないので、もっと気持ち悪い「Akiko~」にした。それで、「こんな遅い時間に何をしているのかな」は「What are you up to so late at night cutie?」になった。最初の日本語の言葉はたくさん句読点を使っているので、ちょっと気持ち悪い感じを伝えている。だから、英語のバージョンは「Cutie」を入れた。それで、「ナンチャッテ」は古い冗談の言い方なので、英語のバージョンは「JK(Just kidding)」にした。

こうした例は、ほとんど普通の日本語を使っていても、AIがあまり良い翻訳ができなかったことを表している。絵文字と顔文字とちょっとだけ変な句読点が入っているメッセージで、このレベルの翻訳しか作れないということは、翻訳AIはまだ信頼できないということではないだろうか。おじさん構文ではなくても、もっと難しい日本語のスラングや難しい文法の使い方など現在の若者の短縮された言葉を翻訳したかったら、今の翻訳AIは翻訳できないかもしれない。

 

結論

 

言語は毎日変わり、世代によって使い方の違いがある。AIはいつも新しい話し方を学ばなければならず、特にスラングの翻訳方法を学ぶべきかもしれない。しかし、これは翻訳AIだけの問題ではない。人間の翻訳家も言葉の文化的な意味をどのように伝えるのが一番良いのか考えなければならない。理解が簡単にできない文を翻訳する方法も見つけなければならない。おじさん構文はこのような言葉の意味が隠れていることがあるという一つの例だ。今後も、おじさん構文みたいな変な書き方や話し方が登場することで、翻訳AIと翻訳家の仕事が増えるのではないかと思う。

 

感想

 

このプロジェクトでAIの印象的なポイントもまだ改善しなければならないポイントも感じられた。日常生活ではもちろんAI翻訳プログラムを使うけれど、おじさん構文のトピックに関してはグーグルとDeepLはまだ若者言葉とか文化的なコンセプトを上手く翻訳できないことを学んだ。これまで日本語を勉強した経験からDeepLは言葉の意味をよく伝えられることが分かった。しかし、今回のプロジェクトからもっと長い段落とかテキストを翻訳したかったら、気をつけた方がいいことも学んだ。

このプロジェクトと自分の経験を考えるとAIはやはり便利なツールだと感じた。AIは辞書にはない言葉と「おじさん」のような英語に具体的に翻訳できない言葉を翻訳するのが苦手なので、自分の考えと感想を検討しながら翻訳したらいいのではないだろうか。さらに、句読点、顔文字、絵文字をAIに入れると変で不自然な翻訳が普通に出てくる。正規の日本語以外だとAIからまだ不自然な翻訳が出る可能性がある。このような苦手なポイントを意識すべきである。もっと早く翻訳するためにAIを使っている翻訳家は自分の文化的、言語的な知識を入れるべきだと考える。この問題は翻訳家だけのものではない、多くの仕事はAIの影響力を心配している。プログラマーもAIと戦う必要があるのかと聞いている。しかし、プログラマーの今の考えはAIが問題ではなく、AIを使っているプログラマーが他のプログラマーたちの仕事を奪っているという事である。これは翻訳家にも適用できる。現在の翻訳仕事はAIを使う翻訳家と使わない翻訳家に分けることができる。

翻訳の完全性を守るために人間のアイデアは必要なのではないでしょうか。このプロジェクトをする前、AIが人間の仕事を奪い、美術や音楽が人間によってなのかそれともAIが作ったものなのか分からなくなるのは怖いと思ったけれど、思ったより怖くないのかもしれない。AIの翻訳はまだ完璧ではなく人間らしくないので、心配するほどではないんじゃないかと思うが、今後もツールとして社会に溶け込んでいけそうだ。