diff --git a/01-introduction-to-genai/translations/ja-jp/README.md b/01-introduction-to-genai/translations/ja-jp/README.md index c2af78323..af436ca12 100644 --- a/01-introduction-to-genai/translations/ja-jp/README.md +++ b/01-introduction-to-genai/translations/ja-jp/README.md @@ -7,14 +7,14 @@ 生成系 AI は、テキストや画像などのコンテンツを生成する人工知能です。この技術が素晴らしいのは、AI を誰にでも使えるようにしている所で、自然言語で書いた文章やテキスト・プロンプトだけで利用できる点です。 価値あることを成し遂げるために、Java や SQL のような言語を学ぶ必要はありません。自分の言葉で要望を伝えるだけで、AI モデルから提案が返ってきます。この技術を使えば、報告書を書いたり理解したり、アプリケーションを作成したりといったことが、わずか数秒で可能になります。その可能性と影響力は計り知れません。 -このカリキュラムで、新興企業が教育分野で新たな可能性を切り開くために生成系 AI をどのように利用しているか、またその応用に伴う社会的影響や、技術的な制限によって避けられない課題にどう対処しているかを詳しく見ていきます。 +このカリキュラムで、スタートアップ企業が教育分野で新たな可能性を切り開くために生成系 AI をどのように利用しているか、またその応用に伴う社会的影響や、技術的な制限によって避けられない課題にどう対処しているかを詳しく見ていきます。 ## レッスン内容の紹介 このレッスンでは、下記の内容について説明します。 -* ビジネスシナリオの紹介: スタートアップのアイデアとミッション -* 生成系 AI と、どのような経緯で現在の技術的な状況にたどり着いたのか +* ビジネスシナリオの紹介: スタートアップのアイデアとミッション +* 生成系 AI と、技術的な歴史背景 * 大規模言語モデルの内部動作 * 大規模言語モデルの主な機能と実用的なユースケース @@ -25,17 +25,17 @@ * 生成系 AI とは何か、そして大規模言語モデルの仕組みを理解する * 教育シナリオに重点を置き、さまざまなユース・ケースで大規模言語モデルを活用する方法を理解する -## シナリオ: 教育関連事業をターゲットにする新興企業 +## シナリオ: 教育関連事業をターゲットにするスタートアップ企業 -生成系 AI は AI 技術の最高峰に位置付けられ、かつて不可能と考えられていた限界を押し広げています。 -生成系 AI モデルは様々な機能と用途を持っていますが、このカリキュラムでは、架空の新興企業を通じて教育分野でどのように革新していくのかを学んでいきます。この新興企業を「スタートアップ」と呼ぶことにします。 -我々スタートアップは、教育の領域において下記の野心的な目標を持って事業を行っています。 +生成系 AI は AI 技術の最高峰に位置付けられ、かつては不可能と思われていたことにも挑戦し、新たな可能性を広げています。 +生成系 AI モデルは様々な機能と用途で利用可能ですが、このカリキュラムでは、架空のスタートアップ企業を通じて教育分野でどのように革新していくのかを学んでいきます。この新興企業を「スタートアップ」と呼ぶことにします。 +スタートアップは、教育の領域において下記の野心的な目標を持って事業を行っています。 -> *世界規模で学習の利便性を高め、教育に対する平等な機会を実現し、学習者一人ひとりの要望に応じた個別学習体験を提供します。* +> *世界規模で学習の利便性を高め、教育に対する平等な機会を実現し、学習者一人ひとりの要望に応える個別学習体験を提供します。* -スタートアップ・チームは、現在の最も強力なツールである大規模言語モデル(LLM)を活用せず、この目標を達成する事はできないと認識しています。 +スタートアップ・チームは、現在最も強力なツールである大規模言語モデル(LLM)を活用せず、この目標を達成する事は難しいと考えています。 -生成系 AI を利用すると、生徒は 24 時間いつでも問い合わせ可能なバーチャルの教師から大量の情報や例を得られるようになり、教師も生徒の成績を評価しフィードバックするために、新しいツールが使えられるようになると考えられ、現在の学習方法や指導方法に革命をもたらすと考えられています。 +生成系 AI を利用すると、生徒は 24 時間いつでも問い合わせ可能なバーチャルの教師から、大量の情報や例を得られるようになり、教師も生徒の成績を評価しフィードバックするために、新しいツールが使えられるようになると考えられ、現在の学習方法や指導方法に革命をもたらすと考えられています。 ![モニターを見つめる5人の若い学生 - DALLE2による画像](../../images/students-by-DALLE2.png?WT.mc_id=academic-105485-yoterada) @@ -43,7 +43,7 @@ ## 生成系 AI はどのようにして生まれたのでしょうか? -最近、生成系 AI モデルの発表は大きな注目を集めていますが、この技術は数十年にわたる開発の歴史があり、初期の研究は1960年代までさかのぼります。そして今、AI 技術は [OpenAI の ChatGPT](https://openai.com/chatgpt) や [Bing Chat](https://www.microsoft.com/edge/features/bing-chat?WT.mc_id=academic-105485-yoterada) のように会話能力を有するなど、人間の認知能力を持つレベルに達しております。また、これらのチャットシステムは、Bing のウェブ検索における会話でも GPT モデルを採用しています。 +最近発表された、生成系 AI モデルは大きな注目を集めていますが、この技術は数十年にわたる開発の歴史があり、初期の研究は 1960 年代までさかのぼります。そして今、AI 技術は [OpenAI の ChatGPT](https://openai.com/chatgpt) や [Bing Chat](https://www.microsoft.com/edge/features/bing-chat?WT.mc_id=academic-105485-yoterada) のように会話能力を有するなど、人間の認知能力を持つレベルにまで達しています。また、これらのチャットシステムは、Bing の Web 検索における会話でも GPT モデルを採用しています。 AI の歴史を振り返ると、初期の AI のプロトタイプは、タイプライター式のチャットボットで、専門家集団から抽出した知識をベースに、それをコンピューターに表現していました。知識ベースによる回答は、入力テキスト内に出現するキーワードがトリガーになっていました。しかし、タイプライター式のチャットボットは、スケール・アウトが難しい事がすぐに分かりました。 @@ -54,11 +54,11 @@ AI の歴史を振り返ると、初期の AI のプロトタイプは、タイ ### ニューラルネットワーク(神経回路網)と最新の仮想アシスタント -最近では、より大量のデータと複雑な計算を処理できるハードウェアの進化が、AI 分野の研究をさらに促進し、ニューラルネットワークやディープラーニング・アルゴリズムと呼ばれる高度な機械学習アルゴリズムの開発につながりました。 +最近では、より大量のデータと、複雑な計算を処理できるハードウェアの進化が、AI 分野の研究をさらに促進し、ニューラル・ネットワークやディープラーニング・アルゴリズムと呼ばれる高度な機械学習アルゴリズムの開発につながりました。 ニューラルネットワーク(特に再帰型ニューラルネットワーク - RNN と呼ばれる)は、自然言語処理を飛躍的に進化させ、文章中に含まれる単語の意味を、文脈を考慮して評価し、より有益な方法でテキストの意図を表現できるようになりました。 -この技術は、21世紀の初頭に登場したバーチャル・アシスタントの基盤となり、人の言葉を読み取って要求を識別し、それに応じた行動を取ることができます。例えば、事前に用意したスクリプトで応答したり、外部サービスを利用することが含まれます。 +この技術は、21 世紀の初頭に登場したバーチャル・アシスタントの基盤となり、人の言葉を読み取って要求を識別し、それに応じた行動を取ることができます。例えば、事前に用意したスクリプトで応答したり、外部サービスを利用することが含まれます。 ### 現在の生成系 AI @@ -78,7 +78,7 @@ AI の歴史を振り返ると、初期の AI のプロトタイプは、タイ ![トークン化の例](../../images/tokenizer-example.png?WT.mc_id=academic-105485-yoterada) -* **出力トークンの予測**: 入力として n 個のトークンを受け取ると(モデルによってnの最大値は異なります)、モデルは出力として 1 個のトークンを予測する力を持っています。この予測されたトークンは次の反復処理の入力に追加され、拡張ウィンドウ・パターンにより、ユーザーが 1 つ以上の文を回答として得られるようになります。これは、ChatGPT を試したことがある人なら、文の途中で時々処理が停止するような動きにつながる理由です。 +* **出力トークンの予測**: 入力として n 個のトークンを受け取ると(モデルによって n の最大値は異なります)、モデルは出力として 1 個のトークンを予測する力を持っています。この予測されたトークンは次の反復処理の入力に追加され、拡張ウィンドウ・パターンにより、ユーザーが 1 つ以上の文を回答として得られるようになります。これは、ChatGPT を試したことがある人なら、文の途中で時々処理が停止するような動きにつながる理由です。 * **選考過程、確率分布**: モデルは、現在のテキストの順番の後ろに続く文字を、確率的に可能性の高い結果に基づいて出力トークンを選びます。これは、モデルが過去の訓練に基づいて、「次に出現するトークン」の各選択肢についてどれだけの確率があるかを計算し、その全体の確率分布を推定しているからです。ただし、得られた分布から最も確率の高いトークンが必ず選ばれるとは限りません。この選択には、ある程度のランダム性が導入されており、モデルが決定的に振る舞わないようにしています。- つまり同じ入力に対して必ずしも同じ出力が得られるわけではないのです。このランダム性は、創造的な思考過程を模倣するために導入され、温度(temperature)というパラメータで調整ができます。 @@ -91,18 +91,18 @@ AI の歴史を振り返ると、初期の AI のプロトタイプは、タイ しかし、具体的にどのようなテキストの入力と出力を想定しているのでしょうか? 大規模言語モデルの入力は「プロンプト」と呼ばれ、出力は「コンプリーション」と呼ばれています。これは、モデルが現在の入力に続く次のトークンを生成する仕組みを表しています。これからプロンプトの意味や、モデルを最大限に活用するための設計方法について詳しく見ていくことになりますが、とりあえず現時点では、プロンプトは以下のような要素が含まれるとお考えください: -モデルに対して、期待する出力の種類を指定する**指示**。この指示には、場合によって具体例やその他のデータを追加で組み込むことがあります。 +* モデルに対して、期待する出力の種類を指定する**指示**。この指示には、場合によって具体例やその他のデータを追加で組み込むことがあります。 1. 記事、書籍、製品レビューなどの要約と、非構造化データから知見(インサイト)の抽出 ![Example of summarization](../../images/summarization-example.png?WT.mc_id=academic-105485-yoterada) - +
- 2. 記事、エッセイ、課題などのアイデアとデザインの作成 + 1. 記事、エッセイ、課題などのアイデアとデザインの作成 ![Example of creative writing](../../images/creative-writing-example.png?WT.mc_id=academic-105485-yoterada) - +
* エージェントに対して会話形式で尋ねる**質問**