以前のブログで画像生成AIを使ってみた内容のブログ記事を書きました。
今回はChatGPTについての簡単な説明とその他のAIに関することを紹介します。
それとAIの現状とAIの発達によって起こるであろう未来について、改めて独自の考察をしてみたいと思います。
現在のAI技術
まずは有名なところから。
ChatGPTはOpenAIによって2022年11月30日にリリースされました。
テキストを打ち込めばAIがそれに答えてくれるという画期的な人工知能チャットボットで、専門的な内容や普通の会話までこなしてしまいます。
この対話型 AI は近年急速に普及しています。この技術が登場した背景にはいくつかの要因があります。
まず、自然言語処理(NLP)技術の進歩。次に機械学習(ML)技術の進歩が挙げられます。
そして次にインターネットの普及により、大量のテキストデータが容易に入手できるようになったことで、対話型 AI の学習データが充実しました。
これにより対話型 AI はより高度な機能を実現することができるようになりました。
これらの要因が重なり対話型 AI は近年急速に普及しています。
ChatGPTの機能
ChatGPT は会話型 AI と呼ばれています。
人間が入力した質問に答える形で文章を返してくるので「対話型 AI」とも呼ばれていて、自由度の高い会話をしながら自然な文章が生成できるのが特徴。
創作分野をはじめ、プログラミング開発、カスタマーサポートといったビジネス領域、そして教育の現場などさまざまな領域に影響が及ぶため、いま世界中で大きな注目を集めています。
ChatGPT は、テキストとコードの大規模なデータセットでトレーニングされた大規模な言語モデル。
テキストの生成、言語の翻訳、さまざまな種類のクリエイティブコンテンツの作成、質問への回答を有益な方法で行うことができます。
- 使用者の指示に従い、使用者の要求を慎重に完了するように最善を尽くします。
- オープンエンド、やりがいのある、または奇妙な質問であっても、その知識を使用して包括的かつ有益な方法で質問に答えます。
- 詩、コード、スクリプト、楽曲、メール、手紙など、さまざまなクリエイティブなテキスト形式のテキストコンテンツを生成します。
ChatGPT は他にも色々な用途で使用しています。
- カスタマーサポート:ChatGPT は、顧客からの質問に答えたり、問題を解決したりするために使用できます。
- 教育:ChatGPT は、生徒に個別の指導を提供したり、新しい概念を教えたりするのに役立ちます。
- 創作:ChatGPT は、詩、コード、スクリプト、楽曲、メール、手紙など、さまざまなクリエイティブなコンテンツを生成するために使用できます。
- 研究:ChatGPT は、大量のテキストデータを検索して分析するために使用できます。
ChatGPT はまだ開発中とのことですが、開発中というより日々アップデートを重ねていくツールじゃないかと思います。
*現在はGPT3.5、GPT4、GPT4 Turboなどがあります。
尚、Microsoft社はOpenAIに対して多額の投資とパートナーシップを結んだことにより、Microsoft Copilot にはGPT4が実装されています。
その他の対話型AI
チャットボットや仮想アシスタントなど、対話型AIの代表的な例をいくつか挙げます。
- Amazon Alexa
- Apple Siri
- Google Assistant
- Microsoft Cortana
- IBM Watson
- Mitsui Fujitsu Conversational AI for Enterprise
- Preferred Networks Chatterbot
- Ricoh Chatbot
- Salesforce Einstein Platform
これらのチャットボットや仮想アシスタントはさまざまなタスクに使用できます。
たとえば天気予報を尋ねたり、アラームを設定したり、質問に答えたりすることができます。
またニュースや交通情報などの最新情報を提供したり、レストランの予約や配達注文をしたりすることもできます。
*最近ではMicrosoftのBing(現Copilot)なども登場しています。GoogleもGeminiを発表し、こちらもかなり優秀ですので使ってみて下さい。
ChatGPTの登場以来、対話型AIも年々進化しています。各企業もAI関連の競争が激しくなっています。
代表的な画像生成AI
ネットやYouTubeでも話題沸騰の「Stable Diffusion」
なぜ普及したかのか・・・やはりオープンソースということが大きな要因だと思います。
動作環境が整っていれば誰でも画像生成できるというのは画期的です。
そもそもStable Diffusionは、2022年に公開されたディープラーニングのtext-to-imageモデルです。
主にテキスト入力に基づく画像生成(text-to-image)に使用されますが、他にもインペインティング、アウトペインティング、テキストプロンプトによって誘導される画像に基づく画像生成(image-to-image)にも使用されます。
ですからStable Diffusionを使えばだれでもプロ並みの画像が作成できてしまうんです。
その他にも画像生成AIには様々な種類があります。
一般的に普及している画像生成AIの代表として、Adobe Firefly、DALL·E 3、Midjourneyなどが挙げられます。
その他にもブラウザ上で画像生成ができるツールも続々登場しています。
代表的な音声合成AI
音声合成AIの主なソフトとして、CeVIO Creative Studio、Amazon Polly、VOICEVOXなどが挙げられます。
この音声合成AIは様々な用途で使用されています。
例えば CeVIO Creative Studio は、文章の読み上げや歌うことができるソフトです。
Amazon Polly は、ディープラーニングで構築した学習モデルを活用して、テキストデータを音声に変換するAWSのサービスです。
Amazon Pollyでは、ニュースリーダー、ゲーム、eラーニングプラットフォーム、視力が弱い方向けのアクセシビリティアプリケーション、および急速に成長しているIoT分野などが一般的なユースケースとされています。
VOICEVOX は、ヒホ(ヒロシバ)氏により開発されたフリーのテキスト読み上げ用音声合成ソフトウェアです。最近ではYouTubeでも使用している方が多くなっています。
特に「ずんだもん」の音声を使った動画が増えてきています。
今後起こるAIの未来
前置きが長くなってしまいましたが、2023年5月現在でもこれだけのAIに関する情報が溢れています。そのことを理解してもらいたかったので解説しました。
この先もこのようなAIに関するニュースが出現し、AIに関わる企業もますます増えていくと思われます。
今現在でもこれだけのAIに関する技術が進んでいるということは、将来人間が関わる大半の事をAIが行うということです。
ある有名な方のお話で「学校教育もAIにやらせたほうが上手くいくんじゃないの?」って言ってました。
医療関係なども、今までは医師のこだわりで治療方法や処方する薬も医師の考えで行っていたものを、変わりにAIにやらせた方が確実じゃないのか・・・とも仰ってました。
AIならもっと効率良く判断できると思います。
AI社員の登場
前回のブログでも書きましたが、映像に関わるものがAIに取って代わられる時代が来ると思います。
現に、スイスでAIの女性気象予報士を使用したところ「本物と変わらない」との反響があったそうです。
スイスで「AIお天気お姉さん」誕生、あまりのリアルさに驚きの声 - ネット「未来キタ」「本物にしか見えない」スイスの放送局「M Le Média」が、新たな女性気象予報士にAIアバターを起用したのだが、そのあまりに自然な表情や動きに注目が集まっている。ネットでは「未来キタ」「本物のお姉さんにしか見えないんだけど!」と驚きの声が上がっている。スイスの放送局「M Le Média」が、新たな女性気象予報士にAIアバターを起用したそうです。そのあまりに自然な表情や動きに注目が集まっています。
この女性気象予報士は、**Jade (ジェイド)**と呼ばれるAIで生成された女性アバターで、現地時間4月3日から登場し、朝の天気予報を担当しているそうです。
Jadeは病気もせず、休暇もいらず、毎日決まった時間に確実に天気を伝えられるという、通常の気象予報士にはない特徴を持っています。
放送局の責任者であるPhilippe Morax氏によると、「数名の(人間の)候補者と面談を行ったが、適任が見つからなかった」という理由から、AIアバターのJadeを起用したという。
またこの取り組みは、メディアのイノベーション戦略の一環であり、「視聴者に質の高いコンテンツを提供するため」だとしています。
じゃあ人間はどうすればいいの?ってことになりますが、いくらAIが優秀でも人間には及ばないところがあります。
職人技のような技術、スポーツのような運動とかでしょうか。
AIは効率的かもしれませんが、AIには人間の道徳的思考やこだわり、感性、想像力はまだまだ理解できないでしょう。
しかしそれも時間の問題です。
*新しい業種「プロンプト・エンジニア」
「プロンプト・エンジニア」はテキストや画像などを生成するAIに対して高品質のコンテンツが生成されるように命令を出すエンジニアのことです。
ChatGPTやMidjourneyなどのAIサービスが登場し、プロンプト・エンジニアの需要は非常に高まっています。
この職業は、Webサイトやコンテンツ制作、翻訳などの分野で必要とされる職種であり、今後は市場の拡大が予想されている職業です。
この職種は、近年急速に普及している生成型AIツールと同時に需要が飛躍的に向上していると言えます。
まとめ
AIの発達を「脅威」と捉えるか「歓迎」と捉えるかは個々の自由です。
ですが人々の生活において大変便利になることは確実です。
この世の中の動きを前向きに捉えるかどうかが今後のAIの発展に繋がると思います。
*YouTube「マイキーの非常識な社会学」で、AIの分野でこれから伸びる国家、半導体の企業ついて語っています。マイキーさんの動画はかなり勉強になりますので是非ご覧になってください。