Skip to content

Commit

Permalink
Modified Japanese expression
Browse files Browse the repository at this point in the history
Modified Japanese expression
  • Loading branch information
yoshioterada committed Dec 21, 2023
1 parent c7bf2f5 commit 81cad3a
Show file tree
Hide file tree
Showing 6 changed files with 109 additions and 109 deletions.
28 changes: 14 additions & 14 deletions 01-introduction-to-genai/translations/ja-jp/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -5,7 +5,7 @@
> *(上記の画像をクリックすると、レッスン・ビデオを表示します)*
生成 AI は、テキストや画像などのコンテンツを生成する人工知能です。この技術が素晴らしいのは、AI を誰にでも使えるようにしている所で、自然言語で書いた文章やテキスト・プロンプトだけで利用できる点です。
価値あることを成し遂げるために、Java や SQL のような言語を学ぶ必要はありません。自分の言葉で要望を伝えるだけで、AI モデルから提案が返ってきます。この技術を使えば、報告書を書いたり理解したり、アプリケーションを作成したりといったことが、わずか数秒で可能になります。その可能性と影響力は計り知れません。
皆様にとって価値のある何らかの成果を出すために、Java や SQL のような言語を学ぶ必要はありません。自分の言葉で要望を伝えるだけで、AI モデルから提案が返ってきます。この技術を使えば、報告書を書いたり理解したり、アプリケーションの作成が、わずか数秒でできるようになります。その可能性と影響力は計り知れません。

このカリキュラムで、スタートアップ企業が教育分野で新たな可能性を切り開くために生成 AI をどのように利用しているか、またその応用に伴う社会的影響や、技術的な制限によって避けられない課題にどう対処しているかを詳しく見ていきます。

Expand All @@ -27,8 +27,8 @@

## シナリオ: 教育関連事業をターゲットにするスタートアップ企業

生成 AI は AI 技術の最高峰に位置付けられ、かつては不可能と思われていたことにも挑戦し、新たな可能性を広げています。
生成 AI モデルは様々な機能と用途で利用可能ですが、このカリキュラムでは、架空のスタートアップ企業を通じて教育分野でどのように革新していくのかを学んでいきます。この新興企業を「スタートアップ」と呼ぶことにします
生成 AI は AI 技術の最高峰に位置付けられ、かつては不可能と思われていた領域にも挑戦し、新たな可能性を広げています。
生成 AI モデルは様々な機能と用途で利用可能ですが、このカリキュラムでは、架空のスタートアップ企業を通じて教育分野でどのように革新していくのかを学んでいきます。この新興企業を「スタートアップ」と呼びます
スタートアップは、教育の領域において下記の野心的な目標を持って事業を行っています。

> *世界規模で学習の利便性を高め、教育に対する平等な機会を実現し、学習者一人ひとりの要望に応える個別学習体験を提供します。*
Expand All @@ -49,24 +49,24 @@ AI の歴史を振り返ると、初期の AI のプロトタイプは、タイ

### 統計学的手法を基にした AI 技術: 機械学習

1990年代に入り、テキスト解析に統計学的手法を応用したことで、転換点が訪れました。
これにより、データからパターンを学習する新しいアルゴリズムが開発されました。これは「機械学習」として知られ、学習にプログラミングを必要としませんでした。この手法を用いることで、機械は人間の言語理解を再現することが可能になります。テキストとラベルの組み合わせで訓練された統計モデルが、メッセージの意図を示す定義済みのラベルで、未知の入力テキストを分類することができるようになります
1990年代に入り、テキスト解析に統計学的手法を応用し、転換点が訪れました。
これにより、データからパターンを学習する新しいアルゴリズムが開発されました。これは「機械学習」として知られ、学習にプログラミングを必要としませんでした。この手法により、機械は人間の言語理解を再現できるようになります。テキストとラベルの組み合わせで訓練された統計モデルが、メッセージの意図を示す定義済みのラベルで、未知の入力テキストを分類できるようになります

### ニューラルネットワーク(神経回路網)と最新の仮想アシスタント

最近では、より大量のデータと、複雑な計算を処理できるハードウェアの進化が、AI 分野の研究をさらに促進し、ニューラル・ネットワークやディープラーニング・アルゴリズムと呼ばれる高度な機械学習アルゴリズムの開発につながりました。

ニューラルネットワーク(特に再帰型ニューラルネットワーク - RNN と呼ばれる)は、自然言語処理を飛躍的に進化させ、文章中に含まれる単語の意味を、文脈を考慮して評価し、より有益な方法でテキストの意図を表現できるようになりました。

この技術は、21 世紀の初頭に登場したバーチャル・アシスタントの基盤となり、人の言葉を読み取って要求を識別し、それに応じて行動を取ることができます。例えば、事前に用意したスクリプトで応答したり、外部サービスを利用することが含まれます
この技術は、21 世紀の初頭に登場したバーチャル・アシスタントの基盤となり、人の言葉を読み取って要求を識別し、それに応じて行動を取れるようになります。例えば、事前に用意したスクリプトで応答したり、外部サービスを利用する等が含まれます

### 現在の生成 AI

このような経緯を経て、今日における生成 AI が誕生しました。これはディープラーニングのサブセットとして捉えることができます
このような経緯を経て、今日における生成 AI が誕生しました。これはディープラーニングのサブセットとして考えられます

![AI, ML, DL and Generative AI](../../images/AI-diagram.png?WT.mc_id=academic-105485-yoterada)

長年の AI 研究を経て、*トランスフォーマー* と呼ばれる新しいモデルのアーキテクチャが登場し、RNN の限界を越え、より長文テキストのシーケンスを入力として受け取ることができるようになりました。トランスフォーマーは、アテンションメカニズム(注意機構)を採用しており、モデルが、受け取った入力に対して異なる重み付けを行うことができます。これにより、テキスト内の単語の並ぶ順番に関わらず、最も関連性の高い情報が集中している部分に「より多くの注意を払う」ことができます
長年の AI 研究を経て、*トランスフォーマー* と呼ばれる新しいモデルのアーキテクチャが登場し、RNN の限界を越え、より長文テキストのシーケンスを入力として受け取れるようになりました。トランスフォーマーは、アテンションメカニズム(注意機構)を採用しており、モデルが、受け取った入力に対して異なる重み付けを行います。これにより、テキスト内の単語の並ぶ順番に関わらず、最も関連性の高い情報が集中している部分に「より多くの注意を払う」ようになります

最近の生成 AI モデルの多くは、文章の入出力を行う「大規模言語モデル(LLMs)」とも呼ばれており、実際にこのアーキテクチャに基づいています。これらのモデルが注目される理由は、書籍、記事、ウェブサイトなど様々な情報源から、膨大なラベルなしデータとして訓練されているにも関わらず、創造性を備え文法も正しい文章を作り出すのが特筆すべき点です。したがって、これらのモデルは、機械が入力されたテキストを「理解」する力を飛躍的に向上させただけでなく、人間の言葉で独自の回答を作り出す能力も実現しました。

Expand All @@ -78,20 +78,20 @@ AI の歴史を振り返ると、初期の AI のプロトタイプは、タイ

![トークン化の例](../../images/tokenizer-example.png?WT.mc_id=academic-105485-yoterada)

* **出力トークンの予測**: 入力として n 個のトークンを受け取ると(モデルによって n の最大値は異なります)、モデルは出力として 1 個のトークンを予測する力を持っています。この予測されたトークンは次の反復処理の入力に追加され、拡張ウィンドウ・パターンにより、ユーザーが 1 つ以上の文を回答として得られるようになります。これは、ChatGPT を試したことがある人なら、文の途中で時々処理が停止するような動きにつながる理由です。
* **出力トークンの予測**: 入力として n 個のトークンを受け取ると(モデルによって n の最大値は異なります)、モデルは出力として 1 個のトークンを予測する力を持っています。この予測されたトークンは次の反復処理の入力に追加され、拡張ウィンドウ・パターンにより、ユーザーが 1 つ以上の文を回答として得られるようになります。これは、ChatGPT を試した時に、文の途中で時々処理が停止するような動きにつながる理由です。

* **選考過程、確率分布**: モデルは、現在のテキストの順番の後ろに続く文字を、確率的に可能性の高い結果に基づいて出力トークンを選びます。これは、モデルが過去の訓練に基づいて、「次に出現するトークン」の各選択肢についてどれだけの確率があるかを計算し、その全体の確率分布を推論しているからです。ただし、得られた分布から最も確率の高いトークンが必ず選ばれるとは限りません。この選択には、ある程度のランダム性が導入されており、モデルが決定的に振る舞わないようにしています。- つまり同じ入力に対して必ずしも同じ出力結果が得られるわけではありません。このランダム性は、創造的な思考過程を模倣するために導入され、温度(temperature)というパラメータで調整ができます。

## スタートアップは、大規模言語モデルをどのように活用できるでしょうか?

大規模言語モデルについて、内部動作の理解が深まったところで、ビジネス・シナリオも視野に入れて、大規模言語モデルをうまく活用するための、実践的な例をいくつか見てみましょう。

大規模言語モデルが最も得意とするのは、自然言語で記述されたテキストの入力から、新しいテキストを作ることだと述べました
大規模言語モデルは、自然言語で記述した入力テキストから、新しいテキストを作る処理が最も得意です

しかし、具体的にどのようなテキストの入力と出力を想定しているのでしょうか?
大規模言語モデルの入力は「プロンプト」と呼ばれ、出力は「コンプリーション」と呼ばれています。これは、モデルが現在の入力に続く次のトークンを生成する仕組みを表しています。これからプロンプトの意味や、モデルを最大限に活用するための設計方法について詳しく確認していきますが、とりあえず現時点では、プロンプトは以下のような要素が含まれるとお考えください:

* **プロンプト(指示)**:モデルに対して、期待する出力結果や、出力フォーマットの種類を指定する。この指示には、場合によっては具体例やその他のデータを追加で組み込むことができます
* **プロンプト(指示)**:モデルに対して、期待する出力結果や、出力フォーマットの種類を指定する。この指示には、場合によっては具体例やその他のデータを追加で埋め込めます

1. 記事、書籍、製品レビューなどの要約と、非構造化データから知見(インサイト)の抽出

Expand Down Expand Up @@ -144,11 +144,11 @@ AI の歴史を振り返ると、初期の AI のプロトタイプは、タイ

上記に挙げた例は基本的なものであり、大規模言語モデルの機能を全て網羅したわけではありません。教育分野に限らず、生成 AI が持つ潜在的な可能性と利点を示しています。

また、生成 AI モデルの出力結果は決して完璧ではなく、場合によってはモデルの創造性が逆効果となって、現実を曲解するような言葉を組み合わせたり、不快な言葉を組み合わせて作り出すこともあります。また、生成 AI は知能を持っているわけではありません。少なくとも、批判的思想や創造的な推理、感情を含む広い意味における知能はありません。そして決定論的でもなく、信頼性もありません。なぜなら、誤った参照や内容、声明などからの作り話が、正しい情報と混ざり合い、説得力のある自信に満ちた言葉で、結果が提示されることがあるからです。次のレッスンでは、これらすべての制限に対処し、それらを軽減するために何ができるかを見ていきます。
また、生成 AI モデルの出力結果は決して完璧ではなく、場合によってはモデルの創造性が逆効果となって、現実を曲解するような言葉を組み合わせたり、不快な言葉を組み合わせて回答を作り出します。また、生成 AI は知能を持っているわけではありません。少なくとも、批判的思想や創造的な推理、感情を含む広い意味における知能はありません。そして決定論的でもなく、信頼性もありません。なぜなら、誤った参照や内容、声明などからの作り話が、正しい情報と混ざり合い、説得力のある自信に満ちた言葉で、結果が提示される場合もあるからです。次のレッスンでは、これらすべての制限に対処し、それらを軽減するために何ができるかを見ていきます。

## 課題

この課題では、「生成 AI」に関する知識を深め、まだ生成 AI が導入されていない領域を特定し、そこにどう取り込めるかを検討してください。従来の方法と比べて、どのような違いがあるでしょうか?これまでにできなかったことが、実現可能になるか、作業の速度が上がるかをご検討ください。「問題点」「AIの活用方法」「導入による効果」といった見出しを用いて、皆様がこれから創業する理想の AI スタートアップを 300 文字でまとめてください。可能であれば、ビジネスプランも記述してください。
この課題では、「生成 AI」に関する知識を深め、まだ生成 AI が導入されていない領域を特定し、そこにどう取り込めるかを検討してください。従来の方法と比べて、どのような違いがあるでしょうか?これまでにできなかった処理が、実現可能になるか、作業の速度が上がるかをご検討ください。「問題点」「AIの活用方法」「導入による効果」といった見出しを用いて、皆様がこれから創業する理想の AI スタートアップを 300 文字でまとめてください。可能であれば、ビジネスプランも記述してください。

この課題を達成すれば、マイクロソフトのスタートアップ用インキュベータープログラム、[Microsoft for Startups Founders Hub](https://www.microsoft.com/startups?WT.mc_id=academic-105485-yoterada) への応募資格が得られるかもしれません。Azure や OpenAI の使用クレジット、メンタリング、その他多くの支援を提供していますので、詳細はウェブサイトをご覧ください。

Expand All @@ -160,7 +160,7 @@ AI の歴史を振り返ると、初期の AI のプロトタイプは、タイ
1. 物事を完璧に行い、計算をしたり、正しく動作するコードを生成するのに最適です
1. 同じプロンプトを使用しても、回答が異なる場合があります。また、テキストやコードなど最初に何らかのヒントを得るために利用するのには最適です。しかし、得られた結果は改善する必要があります。

A: 3, 大規模言語モデル(LLM)は決定的ではなく、出力結果にはばらつきがありますが、温度設定を調整することで、ばらつきを制御することが可能です。完璧な結果を期待するべきではありません。LLM は皆様の負担を軽減するために存在し、物事を始める際に最初の良い出発点を提供します。 ただ多くの場合、段階的に改善していく必要があるでしょう。
A: 3, 大規模言語モデル(LLM)は決定的ではなく、出力結果にはばらつきがありますが、温度設定を調整し、ばらつきを制御できます。完璧な結果を期待するべきではありません。LLM は皆様の負担を軽減するために存在し、物事を始める際に最初の良い出発点を提供します。 ただ多くの場合、段階的に改善していく必要があるでしょう。

## お疲れ様でした! 次のレッスンを続ける

Expand Down
Loading

0 comments on commit 81cad3a

Please sign in to comment.