by Robert Hryniewicz
この記事は、2024/6/11 に公開された「Fueling Enterprise Generative AI with Data: The Cornerstone of Differentiation」の翻訳です。
現在、企業の3分の2以上が、大規模言語モデル (LLM) などの生成AIモデルを使用しており、テキスト、画像、ビデオ、音楽、さらにはコードを人のように理解し、生成することができます。しかし、これらのモデルの真の力は、企業独自の文脈に適応する能力にあります。企業独自のデータを活用することで、生成 AI モデルはビジネス特有のニーズや目的に沿った、高度に関連性のあるカスタマイズされたアウトプットを生成することができます。
構造化データと非構造化データ:洞察の宝庫
企業データにはさまざまな種類がありますが、主に構造化データと非構造化データの2つに分類されます。構造化データは、データベースやデータウェアハウスで容易に検索できるように高度に整理され、フォーマットされています。このデータには、日付、クレジットカード番号、顧客名など、あらかじめ定義されたフィールドが含まれることが多く、従来のデータベースツールやアルゴリズムで簡単に処理および照会ができます。
一方、非構造化データにはあらかじめ定義された形式や構造がないため、管理や利用が複雑になります。この種のデータには、文書、Eメール、画像、動画などのさまざまなコンテンツが含まれます。ありがたいことに、生成 AI モデルは構造化データと非構造化データの両方に隠された洞察を活用することができます。その結果、これらのモデルによって、組織は新たな機会を解き放ち、ビジネスを全方位に見渡すことができるようになります。
例えば、金融機関は生成 AI を使用して、Eメール、チャットログ、通話記録など、さまざまなチャネルにわたる顧客とのやり取りを分析し、パターンや感情を特定することができます。この非構造化データをLLMに供給することで、金融機関はパーソナライズされたアドバイスを生成したり、顧客サービスを改善し、潜在的な詐欺行為を検出したりすることができます。
シームレスなデータアクセスにおけるオープンデータレイクハウスの役割
生成 AI の可能性を十分に活用するためには、企業はデータへのシームレスなアクセスが必要です。これは企業にとって課題であることが分かっており、ビジネスリーダーやテクノロジーリーダーのわずか4パーセントしか、自社のデータに完全にアクセス可能であると回答していません。そこで、オープン・データ・レイクハウスが登場します。生成 AI の導入に必要な強力なデータ基盤の構成要素です。オープンデータレイクハウスは、データのサイロ化を解消し、さまざまなソースからのデータの統合を可能にし、生成 AI モデルですぐに利用できるようにします。
Cloudera のオープン・データ・レイクハウスは、大量の構造化データおよび非構造化データを保存、処理、分析するためのセキュアでガバナンスを備えた環境を提供します。ビルトインのセキュリティとガバナンス機能により、企業は生成 AI アプリケーションにアクセス可能でありながら、データを確実に保護し、業界規制に準拠させることができます。
企業データを生成 AI モデルに投入することで、企業は高度に文脈に沿った関連性の高いアウトプットを作成できます。例えば、製造会社は生成 AI を使用してセンサーデータ、メンテナンスログ、生産記録、参照した運用ドキュメントを分析し、潜在的な機器の故障を予測し、メンテナンススケジュールを最適化することができます。企業固有のデータを取り入れることで、生成 AI モデルは企業独自の運用環境に合わせた正確かつ実用的な洞察を提供し、ビジネスの ROI を促進することができます。
データドリブン型生成AIの成功の実例
シンガポールの大手金融機関であるOCBC銀行は、顧客サービスと内部業務を強化するために生成 AI を活用しました。顧客との対話データと金融取引記録を LLM に入力することで、OCBC 銀行はパーソナライズされた金融アドバイスとサポートを提供する AI 搭載チャットボットを開発しました。同行のチームは、販売、サービス、その他の変数に関連する顧客との会話からリアルタイムの文脈データを分析し、独自の洞察と業務改善の機会を提供するために機械学習を使用する、集中型プラットフォーム「Next Best Conversation」を構築しました。また、生成 AI を利用して文書処理を自動化し、手作業を減らして効率を向上させています。
また、あるグローバル製薬会社は、創薬と開発を加速するために生成 AI を活用しました。臨床試験、研究論文、患者記録の構造化データと非構造化データを統合することで、同社は生成 AI モデルを訓練し、潜在的な新薬候補を特定し、その有効性と安全性を予測しました。このデータドリブン型のアプローチにより、新薬の上市にかかる時間とコストが大幅に削減されました。
これらの実例は、企業データと生成 AI を組み合わせることによる変革力を示しています。独自のデータ資産を活用することで、業界を問わず、企業は新たな機会を解き放ち、イノベーションを推進し、競争力を得ることができます。
Cloudera が、どのようにエンタープライズ AI の取り組みを加速させることができるか、ウェブサイトも合わせてご確認ください。