DX推進|知る×学ぶ
コグニティブ検索・アナリティクスを活用できる業界とは|製薬企業の事例
情報検索の枠を超え、ビジネスに新たな示唆を与える「コグニティブ検索」では、自然言語処理(Natural Language Processing : NLP)のアルゴリズムが、テキスト情報から文脈を理解し、ユーザーが求める情報を探し当てることが可能です。(コグニティブ検索の概要についてはコチラ)
従来のキーワード検索では、指定した用語に完全一致または部分一致していなければ、該当する情報を探すことができませんでした。それが自然言語処理により、検索キーワードのシノニムや類語にも関連する情報まで探し出すため、検索精度が著しく向上します。さらに機械学習アルゴリズムを用いることで、検索の意図や情報間の関連性を認識し、ユーザーへ新たなインサイト(知見)の提示まで活用の幅を広げることができます。
このようにコグニティブ検索は、企業内検索エンジンにとどまりません。企業の社内ポータルなどさまざまな業務アプリケーションへの組み込みにより、「人の代わりに欲しい情報を見つけ出してくれる」検索アプリケーションへと発展させることができるのです。
しかし全ての業務で、コグニティブ検索の利用を推奨しているのではありません。目的の情報を検索したらタスクは達成となり、それ以上の何かまで求めない業務では、コグニティブ検索は不要と考えられます。向いているのは、「情報検索により集められた情報から、新しい知見を導き出す」といった、ナレッジの探索です。そのような利用シーンについて、具体的にイメージを湧かせるため、コグニティブ検索・アナリティクスプラットフォーム「Sinequa」の活用事例を、製薬業界の利用メリットに焦点を当ててご紹介します。
▼目次
1. コグニティブ検索・アナリティクスが活用できる業界
2. 製薬企業のインフォメーションドリブンへの変革が、研究開発のスピードアップに繋がる
3. 製薬向けのSinequaユースケース
4. 導入を検討する前に、まずは概念検証(PoC)から
1. コグニティブ検索・アナリティクスが活用できる業界
コグニティブ検索・アナリティクスのテクノロジーは、どのような業界にも導入できます。しかし状況に応じて得られるROI(投資対効果)は大いに異なります。Sinequa導入ユーザーへの顧客満足度調査によると、高いROIが得られた導入事例には、共通する特徴がありました。
以降に挙げる特徴に当てはまる企業は、コグニティブ検索・アナリティクスプラットフォームの導入で、高いROIを上げられる可能性があります。
1-1. 世界各国に拠点を持つグローバル企業
導入に成功していた顧客は、地理的に分散している組織から、一か所にナレッジの集約が求められる企業です。典型的な例が、グローバル製造企業です。同企業は、製品の設計から生産・販売までの各プロセスにおいて、最適な立地条件を有する地域に展開することで、サプライチェーンを維持しています。このような企業では、各拠点で導入されているITシステムがサイロ化して情報が分散する傾向にあります。しかし、販売サイドでは製品、部品、コンポーネントの在庫状況のリアルタイムに把握しなければならないことから、各国に散在している製造拠点の情報の集約が求められます。
そこでSinequaを導入することにより、複数拠点に導入されるさまざまなITシステムを統合して、エンドユーザーに迅速な情報提供をする仕組みを構築できました。このようにサプライチェーン全体における影響のあるコラボレーションに基づいた生産性向上により、従業員が情報検索に費やす時間の削減を積み上げると、大きな利益の向上に繋がるのです。
1-2. 複雑なIT環境と多様性に富んだコンテンツを蓄積している企業
昨今は多くの企業で、ITシステムの普及と共に、文書などの情報管理システムや業務アプリケーションが導入されています。そのため各システムに散在している情報に対し、一括検索を実現するプラットフォームとして、コグニティブ検索・アナリティクスプラットフォームを利用するのは、標準的なアプローチです。
それは「AIを搭載した次世代型エンタープライズサーチとは|企業内検索の最新動向」でも解説しましたが、コグニティブ検索は、エンタープライズサーチを基盤としているからです。Sinequaでは、200種類以上のシステムに接続可能なコネクターが提供されているため、社内ポータルやクラウドストレージ、インターネット、文書管理システムなど複数のシステムへの一括情報検索が可能になります。
上記に述べたのは、エンタープライズサーチのメリットです。これに加え、複雑なITのセキュリティ要件を持つ組織は、Sinequaの利用に適しています。例えば文書管理システムで、部門ごとに異なるアクセス権限が施されているなど、複雑なセキュリティ設定が施されている場合、コネクターがセキュリティ要件を継承し、コンテンツに対するアクション権限を制御します。複雑なセキュリティ設定が施されている個々のシステムへの接続に、Sinequaのコネクターを用いることで、開発コストが掛からなく手動による設定ミスも防げることで、導入リソースを抑えたセキュアな接続が実現します。
さらに、コグニティブ検索は自然言語処理を含んでいます。Sinequaの自然言語処理アルゴリズムは、多言語のコンテンツ解読能力を持ちます。そのため、グローバル企業など多言語により、多様性に富んだ形式のコンテンツやデータを有する企業にとって、利用価値が高いシステムです。
1-3. 「インフォーメーションドリブン」情報の戦略的な活用を目指している企業
ここ数年間、大規模な組織では情報から価値を抽出する取り組みをしています。製薬や製造など新製品の研究開発プロセスを持つ業界を筆頭に、過去に蓄積された情報からより適切な判断をすばやく導き出す、コンサルティングや法律事務所、また顧客サービスの改善がビジネスに大きな影響を与える金融業界などが、コグニティブ検索が導入されている代表的な業界です。
コグニティブ検索を活かせるかどうかは、複数の情報アセットを横断して、検索・アクセスし、単一ポイントに情報を統合した後、どのように情報を活用したいかという戦略を持っているかがキーとなります。AI(自然言語処理や機械学習)を活かせるのは、この点にあるからです。業務課題に対し、情報の戦略的な活用を経営戦略に掲げている企業は、コグニティブ検索・アナリティクスの導入効果を最大化できるでしょう。
このように非定型な情報から引き出した知見(インサイト)により意思決定に役立てるというが概念は、「インフォメーションドリブン」と定義されています。それでは、数値など主に構造化データから知見を得る「データドリブン」に対し、「インフォメーションドリブン」がなぜ、企業の生産性向上に貢献するのでしょうか。製薬企業の事例により、詳しく見ていきましょう。
2. 製薬企業のインフォメーションドリブンへの変革が、研究開発をスピードアップに繋がる
製薬企業が、コグニティブ検索・アナリティクスプラットフォームSinequaを導入し、インフォメーションドリブンへと発展を遂げることで、得られる価値について解説します。
製薬企業の研究開発(R&D)業務では、早期の探索研究から非臨床・臨床試験を経て上市されるまで、長年渡り膨大なデータが蓄積されています。また上市した後も、医薬品の治療効果や副作用について継続的にモニタリングされます。中でも数年にもわたる臨床試験では、大容量の試験データが発生するため、統計学者はデータの分析に課題を感じています。また後続の規制当局に対する薬事申請において、規制要件を満たす申請文書の発行には時間が掛かり、費用もまた掛かります。
このように製薬企業の業務は多岐にわたり、取り扱うデータの種類も幅広いため、各部門や拠点ごとのシステムに蓄積されて共有されていないケースが多く見られます。そのため組織を横断した、迅速な知見の検索が、大きな課題となっています。特に、海外に研究開発の拠点を持つ製薬企業では、知の分散という課題に直面しています。Sinequaの活用により、多数の複雑なデータソースから過去に蓄積された知見による適切な意思決定ができるようになることで、研究開発の効率を高まります。
また、製薬企業が求めるのは、先進的な新規発見です。創薬シーズや薬剤ターゲットの発見では、新奇発想が求められます。一般的には、学術論文や類似した研究テーマの情報など、社内に蓄積された膨大なデータのマイニングにより生み出されることが多いです。しかし、ここに過去のデータ検索だけでは達成しない、AI駆動型であるSinequaが、過去の情報に付加価値をもたらすのです。Sinequaは、文脈化された関連情報とともに価値ある情報を抽出する支援します。これが研究者に、人知を超えたアイデアをもたらしイノベーションを促進するので、上市への期間短縮に貢献するのです。自社の競争力を高めようと、製薬企業に相次いで導入されたSinequa。もはやシステムは、製薬企業にとって、情報検索を効率化させるだけでなく、次の一手となるヒントを与える役割まで期待されています。
- 製薬企業でコグニティブ検索・分析Sinequaを導入する主要なベネフィット
- 研究業務
- 常に最新のサイエンス情報ソースへ接続し、リアルタイムな検索結果が得られる
- 業務スピードの向上により、研究開発(R&D)コストが削減する
- 社内外を問わず、薬理学者、医学者、遺伝学者など特定分野に長けたエキスパートと繋がり、R&Dコラボレーションパートナーを見つけられる
- 開発業務
- 臨床試験データのエビデンスに基づき、臨床試験を最適化する
- 規制文書に埋まっている「患者の声」を検出し、エキスパートにデータをフィードバックすることで、治療方針の改善を図ることができる
研究開発コストに最も影響を与えるのが、臨床試験の成功率です。新薬開発には平均10億ドルものコストを要するため、プロセス全体におけるわずかな改善が、利益率の改善に繋がります。
・治験に掛かる平均コスト-第1相:1億7,000万ドル、第2相:4億ドル、第3相:5億3,000万ドル
・治験のコストは8億ドルから18億ドルです。
・患者/サイトの募集にかかるコストは、患者/サイトあたり平均40,000ドルです。
キーとなるデータを探し出し、インサイトを導き出すのは、研究者にとって重要な成功要因です。コグニティブ検索をベースとしたアプリケーションは研究効率を高め、医薬品開発のタイムラインを数ヶ月短縮しました。 ある大手製薬会社によると、達成したROIは、1つの医薬品につき2,500万ドルとのことです。
Sinequaによる、良い意思決定や業務効率化の支援が、製薬企業の新薬マーケット参入の加速(新薬申請のスピードアップ)に繋がったという事例です。
引用:レミゼラブルとデジタルワークプレース -データアクセスを最適化すると、ソフトROIとハードROIが見えてくる」
(http://ls.ctc-g.co.jp/products/sinequa/blog/article_20200601_2.html)
このように数値やデータだけではなく、非構造化テキストから得られる知見に基づく意思決定、いわゆるインフォメーションドリブンが、企業の競争優位性を高めています。
3. 製薬向けのSinequaユースケース
ここでは製薬企業における、Sinequaの代表的なユースケース(アプリケーション)について紹介します。
3-1. Drug Discovery(医薬品の探索研究)
Sinequaホーム画面(図2)から「Drug Discovery」をクリックすると、なじみのあるGoogleライクな検索画面が表示されます。
図 2. Sinequa検索画面
ここに、調査したいキーワードを入力して検索を開始すると、図3のような検索結果が表示されます。
図 3. Sinequa検索結果表示
一般的な検索エンジンと同様、画面の中央には、Sinequaが接続した複数のデータソースから、検索にヒットした結果が表示されています。PubMedなどの文献や臨床試験、特許情報、FDA、患者などの情報など、検索結果のエビデンスが提示されています。
また、Sinequaでは検索と同時に、自然言語処理による解読が実行されます。そのため、この例では、ヒットした結果を読み取り、コンテンツに合ったIndication(適応疾患)やClinical Process(臨床過程)などのEntity(属性)に、自動的に分類されています。また、検索結果の文章からConceptやDrugなどの用語も抽出されています(上図画面の左右に配置)。特にConceptは、Sinequaが興味ある用語を特定することで、検索のたびに動的に生成されます。いったん検索結果が得られた後、次の検索でもっと情報を深堀りしたいときは、検索キーワードの変更や、検索キーワードの追加により絞り込みするのが一般的です。しかし、良いキーワードが浮かばないという経験をお持ちの方も多いのではないでしょうか。このように検索の精査に役立つのがConceptワードです。次に検索すべきキーワードの見当が付かないときは、Conceptに挙げられる用語は、そのまま次の検索キーワードとして使用できます。Conceptは、特定のサブセクションに対し検索を深堀する上で、利用価値が高い情報です。またConceptは、分析にも利用されます。
続いて分析のため、得られた情報を可視化してみます。ヒートマップ分析では、情報に含まれる2つの異なる要素の頻度の相関をビジュアライズできます(下図)。この例では、論文情報から抽出された遺伝子と副作用の相関を見ており、色が濃さはドキュメント数の多さを示しており相関の強さが考察できます。
図 4. ヒートマップ表示(遺伝子と副作用の相関分析)
XとY軸の要素は、他のConceptに切り替えることで、アドホックな分析が行えます。例えば「製薬企業名」を選ぶと、特定の遺伝子を研究している企業について知見が得られます。
3-2. Expert Search(エキスパートサーチ)
ある研究プロジェクトに適切な研究者をする際に、その分野に長けた人選をしたいと考えるでしょう。これに役立つのは、「いつ、だれが、どのような」業務に携わっていたという経歴から得られる情報です。しかし、このような情報は人事データベースにも登録されていないため、プロジェクトに最適な研究者のアサインができないことは、研究効率を最大化する上でしばしば障壁となっています。これを支援するのが、Sinequaによるエキスパートサーチです。
ここでは「endometorisis and pregnancy」など、指定した検索キーワードの専門知識に長けたエキスパートが検索するユースケースを紹介します。自然言語処理が、研究者により過去に作成された文書や寄稿された論文から、情報の特徴はつまり専門分野の強みであると類推して、エキスパートをサジェストします。エキスパートには360°ビューが動的に作成されるので、寄稿論文や共著者など研究者の繋がりも見ることができます。あらゆるデータソースから抽出された情報を、統合された単一ビューで参照する360°ビューは、過去の実績を踏まえた人選が求められる研究者のアサインには、有効な仕組みとなります。
図 5. 研究者のプロファイルと360°ビュー
3-3. Patents(特許情報)
これまでの解説により、テキスト情報から用語の意味を解釈して、Conceptを抽出するコアテクノロジーは、さまざまな目的に利用できると、ご理解いただけたでしょう。製薬の研究開発で、Sinequaは、特許情報やFDAなど規制当局への申請文書の分析に多く用いられています。文書まるごとSinequaでプレビューを参照できるだけでなく、自動的に抽出されたConcept、例えば薬剤名「Aspirin」とその関連する用語である賦形剤もまたハイライトされるのは、研究者の考察を大きく支援します。
図 6. Sinequaのドキュメントプレビュー
3-4. Electronic Medical Record(電子診療情報、EMR)
EMRデータを自然言語処理により、例えばアンメットメディカルニーズの代表的な疾患である糖尿病について、治療の経過から、特定の特徴を有する治療満足度の低い患者が特定できます。この情報から、治療の改善に関するインサイトを得ることができます。
3-5. リアルタイムな動的プレビュー
どのようなアプリケーションにおいても、複数のデータソースから、統合された単一ビューに情報を表示できる点が、重要なポイントとなっていました。
図 7. 高血圧の最新治療情報に関する統合ビュー 化学構造式や化合物名(化合物のシノニム含む)、論文情報など
しかし忘れてはならないのが、「リアルタイムな情報検索性」です。日進月歩で進化する科学技術において、ある一時点の情報から統合されたビュー(静的)を作成しても、それらはすぐに陳腐化してしまいます。常に最新情報にアクセスできる動的な能力こそが、企業の競争優位性を高めるのだと考えます。
4. 導入を検討する前に、まずは概念検証(PoC)から
これまでにご紹介したSinequaの活用事例は、製薬企業における典型的な使い方です。しかしこの他にも、各社の課題や情報活用の目標に沿って使うことができます。そのためSinequaの導入を成功させるには、第一に解決すべき業務課題の明確化が重要となります。
しかし製薬企業の業務は、研究開発、生産、営業・販売促進、メディカルアフェアーズ、市販後調査、人事/総務、経営企画など多岐にわたっています。そして取り扱うデータの種類もまた、薬理学や薬剤、生物学、遺伝学、化学など科学的データや、統計解析、申請用の臨床試験データ、医師への訪問記録、患者情報、患者の治療満足度に関するソーシャルメディア投稿情報など、幅広いのが特徴です。
このため、必ずしも導入する前から、解決したい課題を絞り込む必要はないと考えています。先ずは企業内で休眠資産となっているデータの利活用からスタートし、安定稼働したら、特定の課題を解決する業務特化型アプリケーションを構築するという段階的導入は、むしろ推奨すべきアプローチです。
コグニティブ検索・アナリティクスは、エンタープライズサーチシステムが基盤となっています。検索エンジンとして機能させるために、先ずは活用したいデータソースへの接続が非常に重要となります。
そこで、本格導入前に必ず概念検証(PoC : Proof of Concept)の実施を推奨しています。概念検証の実施により、Sinequaが休資産となったデータを活用できる状態にすることで、本来設定すべき解決すべき業務課題のゴールが見えてくることもあります。おぼろげに課題の輪郭が見えてきたら、システムで解決可能なゴールを設定できるようになります。それから、小規模にシステムを使ってみることで、運用をシミュレートして判断できます。
また、概念検証で欠かせないのは評価項目の設定です。明示的な合否基準を設けることが、システム選定に失敗しないための重要なポイントとなります。
続いて、製薬企業向けの概念検証で実施される、データソースの種類と課題の組み合わせをご紹介します。
最初の例は研究領域における業務課題です。研究者は、論文データや電子実験ノートなど複数のデータソースに格納されている、情報検索に時間を要しています。そこで、PubMedなどの論文や実験ノートを同時に検索できるだけでも、大幅な業務効率の改善とこれまで見つけられていなかった知見を見出せる効果が期待できます。
概念検証で、これらデータソースへの接続が確認できたところで、次は前章で述べたよう、ターゲット探索に用いるか、またはエキスパートへと発展させるなど、将来の構想を描けるようになります。
次の例は、製薬企業の営業業務です。この領域で多い課題は、医薬情報担当者(MR)が病院を訪問した際の訪問記録が、社内に散在しており、病院毎の訪問記録を全て集めることができないという問題です。そこでSinequaが、MRの訪問履歴データが蓄積されている営業支援システム(例:Salesforce)とファイルシステム(例:Windows共有サーバ、 Box)へと一括検索できるようになると、タイムリーな情報検索だけでなく、中長期的には医療現場のニーズを先取りした案件創出を支援するシステムとしても発展させることが可能になるかもしれません。
以下にSinequaの代表的なコネクター一覧を掲載します。
図 8. Sinequaの代表的なコネクター
標準で約200種類のコネクターを持ち、BI/業務アプリのSAP ERPをはじめ、IDBS社電子実験ノートやPubMedなど製薬業界で用いられるアプリケーションまで、多様なコネクターが提供されています。
そのため概念検証では、データソースに接続するコネクターの開発期間が掛からないので、比較的短期間でデータ接続が実現するため、接続後の業務課題の深堀に時間・リソースを割けるのもSinequaのメリットでしょう。このように、各業務で複数のデータを繋いだ結果、ビジネスメリットの見通しが立てられるのも、概念検証の実施をお勧めする理由です。
概念検証では、最初から全てのデータソースへの接続を目指す必要はありません。優先度の高そうな1~2種類のデータソースへ先ず接続してから、本番導入で別のデータソースへの接続を増やすことができます。
また、接続すべきデータソースを決めきれない場合は、多くの情報量が蓄積されているデータソースに着目してください。たとえ1システムであっても、予想を超えた新奇なナレッジが潜んでいる可能性があります。Sinequaで取り出した情報から、エンタープライズサーチに留まらずコグニティブ検索・アナリティクスへと発展を遂げるSineuqaのポテンシャルを体感していただけるでしょう。
概念検証で足元を固めたら、いよいよ本番導入に向けて次のステップへと進めます。
概念検証から本格的な導入まで一連の技術支援のご相談については、以下よりお問合せください。