Method Article
プロトコルや臨床事例研究の医学の概念を説明するテキストの抽出のための関連するメタデータ テンプレートを紹介しています。このプロトコルを介して生成された構造化されたテキスト値は、臨床の物語の何千もの深い分析をサポートできます。
臨床症例報告 (Ccr) は、観察や医学の洞察力を共有する貴重な手段です。これらのドキュメントの形式が異なります、コンテンツには説明が含まれています多数、新規疾患のプレゼンテーションとトリートメント。これまでのところ、Ccr 内のテキスト データは綿密な分析に役立つこれらのデータをレンダリングする重要な人間と計算の努力を必要とする主な構造ではありません。このプロトコルでは Ccr 内でよくみられる特定の生物医学的概念に対応するメタデータを識別する方法をについて説明します。提供メタデータ テンプレート ガイドとしてドキュメント アノテーション手動および自動の努力の組み合わせにより Ccr の構造を課すことを追求可能性があることを認識します。ここで紹介した方法が (例えば、何千人も Ccr の) 大きい文献コーパスから概念関連テキストの組織にとって適切なより集中されたタスクまたはレポートの小さなセットを容易に簡単に適応させること。結果として得られる構造化されたテキスト データを含むさまざまな後続のテキスト解析ワークフローをサポートするための十分な意味的文脈: CCR を最大化する方法を決定するためのメタ分析の詳細、希少疾患の疫学的研究とモデル開発医療言語すべて作られるかもしれないより実現可能な構造化されたテキスト データを使用して管理します。
臨床症例報告 (Ccr) は、観察や医学の洞察力を共有する基本的な手段です。これらはコミュニケーションと臨床医および医学生のための教育の基本的なメカニズムとして機能します。歴史的に、Ccr は、新興感染症のアカウント、その治療とその遺伝的背景1,2,3,4も提供しています。たとえば、18855,6のルイ ・ パスツールによって人間の狂犬病の最初の治療と7であった患者にペニシリンの最初のアプリケーション両方の Ccr を報告しました。以上 187 万 Ccr は、過去 10 年間の内半分以上 100万 2018 年 4 月に現在公開されています。雑誌は、これらのレポートの8の新しい会場を提供し続けています。独特のフォームとコンテンツ、Ccr が主として構造化されたテキスト データを含む、広大な語彙が含まれて、構造化されたリソースとしての使用を制限する、相互に関連する現象を懸念します。詳細なメタデータを抽出する多大な労力が必要 (すなわち、 「データに関するデータ」、または、この場合は、ドキュメントの内容の説明) Ccr からあり、検索、アクセス、相互運用性、再利用可能な (フェア)9データとして構築します。リソース。
ここでは、テキストと公開された Ccr 内特定生物医学的概念の記述を標準化する数値値を抽出するプロセスをについて説明します。この方法には、注釈をガイドするメタデータ テンプレートが含まれていますこのプロセスの概要については、図 1を参照してください。注釈プロセスのレポートの大規模なコレクションへの応用 (例えば、数千人の疾患の特定の種類の) 機械可読を達成する管理しやすく構造化された注釈付き臨床テキスト、一連のアセンブリを許可ドキュメントで、それぞれの臨床プレゼンテーション内で埋め込まれた生体現象。HL7 によって提供されるようなデータ形式が (e.g、メッセージング標準10または高速医療相互運用性リソース [FHIR]11のバージョン 3)、LOINC12、およびリビジョン 10 の国際統計。病気および関連の健康上の問題 (ICD-10) の分類13記述および臨床的観察を交換するための標準を提供する、これらのデータを囲むテキストをキャプチャしないでくださいも彼らがするものです。私たちの方法論の結果を最高使用して Ccr の構造を適用し、その後の分析、統制語彙とコーディング システムを正常化を容易にする (e.g、ICD 10)、および/または上記臨床データ フォーマットへの変換。.
Ccr をマイニングは、生物医学および臨床情報内の作業の活動領域です。以前の提案の構造を標準化するケース レポートが (e.g、HL7 v2.514を使用してまたは標準化表現用語15) 称賛に値するが、Ccr は次の異なるさまざまないくなりそうだ。自然言語の形式とドキュメントのレイアウト、彼らとして過去世紀の多くのために持っています。理想的な条件の下で新しいケース レポートの著者する包括的なケアのガイドライン16に従ってください。医療の概念を自然言語との関係に敏感なアプローチは、新しいおよびアーカイブ済みレポートでの作業に最も効果的なしたがってかもしれません。統合生物学プロデュース クラフト17などそれらのリソースとベッドサイド (i2b2)18キュレーション自然言語処理 (NLP) の方法をサポートまだ特に焦点 Ccr または臨床物語はありません。同様に、cTAKES19などクランプ20医療自然言語処理ツールは開発されているが、一般的に Ccr の一般的説明されている一般的な概念ではなく、ドキュメント内で特定の単語や句 (すなわちエンティティ) を識別します。
我々 は、Ccr に一般的に含まれる機能のための標準化されたメタデータ テンプレートを設計しています。このテンプレートは、Ccr の構造を課す機能を定義-ドキュメントの内容の詳細な比較のための重要な前駆体-まだ意味のコンテキストを保持するための十分な柔軟性が可能になります。手動アノテーションと計算支援テキストマイニングの両方に適したこのテンプレートに関連付けられている形式を設計するが、それは特に使いやすいマニュアル人手の確認しました。我々 のアプローチは、FHIR21などのフレームワークにからより複雑な (そして、したがって、あまり未熟なすぐに理解できる研究者) を著しく異なります。次のプロトコルでは、各テンプレート データ型、単一の単一の CCR のそれらに対応する値のセットに対応するドキュメント機能を分離する方法について説明します。
テンプレート内のデータ型は、Ccr と患者中心の医療文書の最もわかりやすい一般に。これらの機能の注釈は、主に構造を与えることによってファインダビリティ、アクセシビリティ、相互運用性、および CCR テキストの再利用性を促進します。データ型は、4 つの一般的なカテゴリ: 文書と注釈の識別、ケース レポート識別 (すなわち、文書レベルのプロパティ)、医療コンテンツの概念 (主に概念レベルのプロパティ) および受信確認 (すなわち、の資金の証拠を提供する機能)。この注釈プロセスでは、各ドキュメントには CCR、省略する場合 (実験プロトコルなど) に独立した任意のドキュメントの内容材料の完全なテキストが含まれています。Ccr は、一般的に未満 1,000 単語各;単一コーパスは、理想的には同じ書誌データベースでインデックスを作成するされ、同じ言語で書かれました。
CCR コーパスに適用した場合、ここで説明するアプローチの製品は、臨床の注釈テキストの構造化されたセットです。この方法は完全に手動で実行することができますおよび情報学経験がなくてもドメイン専門家によって行われるように設計されています、それ上で指定した自然言語処理のアプローチを補完するものし、に適切なデータを提供します解析。そのような分析は、Ccr などをよく読む人を超える研究者の観客に興味のある可能性があります。
Ccr の構造体を強制医療言語と生体現象を理解し多数のそれに続く努力をサポートできます。
1. 文書と注釈の同定
注: このカテゴリの値は、注釈プロセスをサポートします。
2 症例報告識別
注: このカテゴリの値はドキュメント レベルの機能を提供する、ドキュメントのファインダビリティの貢献。
3. 医療内容
注: このカテゴリの値は、ドキュメント レベル、概念レベル、およびテキスト レベルの機能を識別します。ドキュメントのアクセシビリティ、相互運用性、再利用性を高めるのに役立ちます。これらの機能は、医学トピックおよびイベントの焦点とのドキュメント コンテンツの概念と意味の類似性を観察する方法を提供します。このセクションのほとんどの項目は、複数のテキスト文を含めることができ、それぞれは、セミコロンを使用して区切る必要があります。
4. 確認
ノート: このカテゴリの値はドキュメント レベルの機能を識別するまだ出版物間で少し一貫性のある構造を持っています。CCR と関連の仕事のためのサポートを提供する組織に関する詳細情報を提供します。このカテゴリには記事で引用された文献の総数のフィールドも含まれています: これはドキュメントがあらゆる種類の他の医療ドキュメントと概念の関係を持っている程度の大まかな指標を提供するものです。このセクションの 4 つのデータ型の中には、以下を提供します。
注釈プロセスの例は図 2に示します。このケース22では、細菌の病原細菌病菌 thailandensisによる感染症のプレゼンテーションについて説明します。補足ファイル 1でテキスト形式で提供されますこの CCR の関連する部分の参考のためいくつかの研究成果本報告についても、比較のために含まれています。実習ではプレーン テキスト、HTML または PDF 形式で提供されているレポートを変換するメタデータの抽出の容易さと効率が向上します。
2 セット完了した CCR メタデータ アノテーションの例は表 2に提供されます。最初の例は、2 番目の例はまれな条件、肢端皮膚炎炎23を公開された CCR から抽出した値を含まれている各値の理想的なフォーマットを説明するために模擬データです。
図 1。ケース レポート注釈ワークフロー 。ここで説明したプロトコルでは、テキスト機能臨床症例の内で頻繁に存在を識別するためのメソッドを提供します。このプロセスには、ドキュメントのコーパスのアセンブリが必要です。一度 1 つのファイルにまとめ、注釈プロセスの製品は、医療概念と事例レポートの中でその説明に関連付けられているテキスト機能を同定できます。この図の拡大版を表示するのにはここをクリックしてください。
図 2。症例の概念に固有のテキストの識別。ケース レポートのテキストに始まり、手動 annotator が進行、ドキュメントをメタデータ テンプレートの各コンポーネントに対応するテキストのセグメントを識別します。識別機能は、青色で強調表示されます。医療の概念に対応するテキストは、赤とその型のラベルが付いた3 番目の列にすべての強調表示されたテキストは、病理タイプを指します。この図の拡大版を表示するのにはここをクリックしてください。
カテゴリ | 説明 | ICD 10 章 | ICD 10 コードの範囲 |
がん | がんや悪性新生物のすべての種類。 | II | C00 D49 |
神経 | 脳や背骨、神経の病気の総称です。 | VI | G00 G99 |
心血管系 | 心臓や血管系の病気の総称です。血液疾患は含まれません。 | IX | I00 I99 |
筋骨格系およびリウマチ性 | 筋肉、骨格、関節や結合組織の病気の総称です。 | XIII | M00 M99 |
消化器 | 消化管と肝臓、膵臓など、消化器官の病気の総称です。 | XI | K00 K95 |
産科と婦人科 | 妊娠、出産、女性の生殖システムや胸に関する病気。 | XIV;XV | O00 O9A;N60 N98 |
感染 | 感染微生物による任意の病気の原因。 | 私 | A00 B99 |
呼吸器 | 肺と気道の病気の総称です。 | X | J00 J99 |
血液 | 血液、骨髄、リンパ節や脾臓の病気の総称です。 | III | D50 D89 |
腎臓と泌尿器科 | 腎臓や膀胱、尿管、前立腺などの男性生殖器などの病気の総称です。 | XIV | N00 N53;N99 |
内分泌 | 代謝性疾患と同様に、内分泌腺の病気の総称です。 | IV | E00 E89 |
口腔顎顔面 | 任意の条件は、口の中、顎、頭、顔や首を含みます。 | XI;XIII | K00 K14;M26 M27 |
目 | 失明を含む眼を含む任意の条件。 | VII | H00 H59 |
耳鼻科 | 耳、鼻および喉の任意の条件。 | VIII | H60 H95。J30 J39 |
肌 | 皮膚の病気の総称です。 | XII | L00 L99 |
まれな | 特別なカテゴリ (https://rarediseases.info.nih.gov/diseases を参照)、アメリカ合衆国でより少ない 20万人に影響を与えるものとして定義されている、まれな病気のレポートのために予約 | NA | NA |
テーブル 1。ドキュメントへのコメントの疾患のカテゴリ。は以下のカテゴリは、メタデータのドキュメント テンプレートの病気システム データ型に使用します。各疾患のプレゼンテーションは、複数の器官系や病因を伴うことがありますと単一症例が複数のカテゴリに対応しています。これらのカテゴリは主国際統計分類の病気および関連の健康上の問題のセクションを区別するために使用されるものに従うリビジョン 10 (ICD-10) コード システム: 対応する ICD 10 章とコードの範囲を提供します。口腔顎顔面の疾患など、いくつかのカテゴリは、ICD 10 システムの複数のセクションに対応します。
データ型 | 例 1 | 例 2 (キャメロン ・ マクレーン 1986) |
文書と注釈の同定 | ||
内部 ID | CCR005 | CCR2000 |
コメント日付 | 2018 年 3 月 2 日 | 2018 年 3 月 1 日 |
症例報告識別 | ||
タイトル | 性心内膜炎の 1 例。 | 肢端皮膚炎炎の病理組織学的眼。 |
著者 | グラント ab さん。チャン CD | キャメロン JD。マクレーン CJ |
年 | 2017 | 1986 |
ジャーナル | 事例報告と医学の世界ジャーナル | 眼科学のイギリス ジャーナル |
機関 | 米国、マサチューセッツ州ボストン最初総合病院循環器科・内科 | ミネアポリス、ミネソタ州 55455 ミネソタ大学医学部眼科学教室 |
対応する著者 | グラント AB | キャメロン JD |
PMID | 25555555 | 3756122 |
土井 | 10.1011/wjmcr.2017.11.001 | NA |
リンク | https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9555555/ | https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1040795/ |
言語 | 英語 | 英語 |
診療内容 | ||
重要な単語 | ブルセラ病;心内膜炎;僧帽弁 | NA |
人口統計学 | 37 歳男性 | 男性の子 |
地理的な場所 | フロリダ;リオ ・ デ ・ ジャネイロ、ブラジル | NA |
ライフ スタイル | 喫煙者。時折アルコールを飲む | NA |
家族の歴史 | 血族の両親の 5 人の子供の 3 分弟は慢性湿疹 | NA |
社会史 | 建設労働者 | NA |
内科・外科の歴史 | 疲労の歴史 | 合併症のない、完全的妊娠の 8 ポンド 9 オンス (3884 g) 製品とき彼は彼の頬に水疱性の発疹を開発した 1 ヶ月歳まで健康で目、鼻、および口の周りの皮膚を巻き込む発疹が広がる腹部と四肢の皮膚病変が認められたも下痢や発育不全;その時皮膚生検示した異型錯角化症性肢端炎; 典型的です広域スペクトルの抗生物質、母乳、および diodoquin; の断続的なコースの次の 6 年間で扱われる部分的に答えた;合計脱毛症、間欠性肢端、最適体重増加; と断続的な下痢を開発ae による中枢神経系の関与に起因する痙性を時代の 8 ヶ月で開発していた11 ヶ月で心肺停止のいくつかのエピソード彼の声帯の調整の欠如気管;生後 18 カ月子は両側性視神経萎縮、網膜血管の若干の減衰だけでなく、精神障害の兆候に関連付けられている検索眼振を開発しました。両側性角結膜炎。皮膚の発疹。第 2 の皮膚生検 3 歳で再びを示した異型錯角化 ae; 典型的です重度の皮膚発疹、下痢;どのいた完全に彼を; 5 歳で検討した時点で解決した二国間総前歯角膜混濁が見られました。中耳炎、尿路感染症、皮膚感染症を含む頻繁な感染症 |
病気システム | 心血管;感染 | 消化器;皮膚;目;まれな |
徴候と症状 | 動悸、前の週の呼吸困難倦怠感、頭痛、悪寒と提示 | 重度眼瞼結膜炎と二国間の前部角膜血管侵入;重度の皮膚発疹、下痢;グラム陰性細菌敗血症;肢端皮膚炎炎、胸腺組織、視神経、視交叉、視索の退化と広範な小脳変性の不在の典型的な皮膚病変 |
併存疾患 | 高血圧;高脂血症 | NA |
診断のテクニックと手続き | 身体検査;心電図検査。血液培養 | 眼の検査;剖検 |
診断 | ブルセラ性心内膜炎 | 肢端皮膚炎炎 |
臨床検査値 | c 反応性蛋白 (9 mg/dl); の増加します。アルカリホスファターゼ (250 u/l) | NA |
病理 | ブルセラ melitensis が血液サンプルから培養しました。 | 右と左の目外観において類似していた角膜の表面全体に平坦化された扁平上皮細胞の 3 つの細胞層に 1 つの厚さで角膜上皮が減った上皮の極性をすべてが失われました。ボーマン膜は、右の角膜の周辺部にのみ識別できます。左の角膜でボーマン膜を識別できません。どちらの目で識別できる変性も炎症性パンヌス毛様体の円形と斜筋の広範な萎縮レンズ莢膜上皮および初期皮質変性変化のいくつかの後部の移行後極; を通して網膜色素上皮細胞の広範な変性網膜が添付され; 中軽度の自己分解変化を示した後極の桿体と錐体の外側セグメントのいくつかの保存しかし、これらの構造体は赤道; 前方完全に失われました。両方の目の神経節細胞と神経繊維層の広汎な損失ほぼ完全にディスクと隣接する視神経の萎縮 |
薬理学的療法 | ゲンタマイシン 240 mg/iv/毎日 | NA |
Inverventional 療法 | 人工弁置換術 | NA |
患者のアウトカム評価 | 回復は順調。退院 | 1971 年 (7 歳) が死亡 |
診断イメージング/ビデオテープ録画 | 2; 1; 0; 1 | 7; 0; 0; 0 |
その他の症例報告との関係 | 5555555 | 23430849 |
治験との関係 | NCT05555123 | NA |
データベースと架橋 | 図書館健康情報: https://medlineplus.gov/ency/article/000597.htm | HighWire - PDF: http://bjo.bmj.com/cgi/pmidlookup?view=long&pmid=3756122;ヨーロッパ PubMed 中央: http://europepmc.org/abstract/MED/3756122;遺伝的アライアンス: http://www.diseaseinfosearch.org/result/143 |
受信確認 | ||
資金源 | 健康/国立心臓、肺、血液研究所の国立研究所 | ミネソタ州のライオンズ クラブ;失明の予防研究復員軍人援護局;アルコールや他の薬物の乱用のミネソタ州のプログラミング |
受賞番号 | (AG) に R01HL123123 | NA |
開示/利益の競合 | グラント博士は、DrugCo のため有料のスポークスマンです。 | NA |
参照 | 4 | 27 |
表 2。臨床ケースの標準化されたメタデータ テンプレート レポートの例注釈。臨床例に共通する機能のセットを報告し、概念レベルの注釈を促進することを示します。このテンプレートは 3 つの主要なセクションに整理される: 識別、医療コンテンツおよび確認、目的と症例報告機能の種類ごとによって与えられる付加的な価値を示します。このテーブルに例注釈、小説の症例報告のいずれかの 2 つのセットが含まれていると、別の条件性肢端炎23レポートから派生。
1 の補足ファイル。臨床症例報告 (チャンらのテキスト2017).ファイルのダウンロードは、こちらをご覧ください。
Ccr の標準化されたメタデータのテンプレートの実装は、彼らのコンテンツより公正を作る、彼らの聴衆を拡大および、応用を拡張できます。医療コミュニケーション教育のツールとして Ccr の伝統的な使用は、次の医療研修 (例えば、医学部学生、インターン、および仲間)、生物医学研究者見つけることができます要約のケース レポートの内容を有効にすることより迅速です理解します。Ccr、メタデータ標準の最大の強みは、ただし、ことは解釈のパターンには、観測を分離データ変換をそれ以外の場合インデックスです。このワークフローは、病態の解明や治療効果のより広範な調査または治療監視ポスト マーケティングの薬剤疫学的解析から構成されるかどうか、ここで提供されるプロトコルは、Ccr を操作するためのワークフローの最初のステップとして使用できます。Ccr 内で識別される構造の特徴は、病気プレゼンテーションと特に珍しい条件のための治療研究者に有用なリソースを提供できます。臨床研究者は、過去の治療記録された症状や副作用やケアの前の基準の改善の程度を分析するためにデータにあります。また、データは新しい治療法の効果、副作用や毒性の欠如またはターゲティング性別、年齢グループ、または遺伝的背景の差異に基づいてのより広範な分析を運転するかもしれない。
構造化メタデータによって提供される利点は、解析または医療言語をモデルに設計されている計算ワークフローに同様に適用されます。構造化された CCR 機能は、レポート作成者がより簡単に機械可読な提供することが地域の (およびいくつかのケースでは、人間が判読できる) の証拠のコンテンツもあります。Ccr 分散できます明示的に指定された観測の欠如に起因する:例えば、患者さんの正確な年齢が指定されていない可能性があります。同様に、臨床医は診断やその結果は自明と考えられていた場合にテストを述べないことがあります。詳細な分析に必要なギャップの例を提供し、潜在的な改善をハイライト Ccr の構造を適用します。広い視野で医療ドキュメントの構造化されたテキスト データの可用性の向上は、自然言語処理 (NLP) 医療24,25で大きなデータから学ぶ努力をサポートしています。
著者が明らかに何もありません。
この作品は、国民の中心、肺および血の協会によって部分で支えられた: R35 HL135772 (P. Ping のような) に国立総合医学研究所: U54 GM114833 (P. Ping、k. ワトソン、西王し)生体イメージング ・生体工学研究所: (A. Bui); する T32 EB016640ホーグ財団と忍博士 Setty; からの贈り物(P. Ping) に UCLA で T.C. Laubisch 基金。
Name | Company | Catalog Number | Comments |
A corpus of clinical case reports | n/a | n/a | Full texts of case reports may be accessed through PubMed (e.g., using the search query "Case Reports"[Filter]), other citation databases such as Europe PMC (https://europepmc.org/) or directly through publishers. |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved