벡터 임베딩을 통해 대규모 언어 모델을 보강하여 도메인별 응답성 향상

Please note that all translations are automatically generated. Click here for the English version.

474 Views

•

03:14 min

•

December 6th, 2024

DOI :

10.3791/66796-v

December 6th, 2024

•

Nathan M. Wolfrath¹^,², Nathaniel B. Verhagen¹, Bradley H. Crotty², Melek Somai², Anai N. Kothari¹

¹Department of Surgery, Division of Surgical Oncology, Medical College of Wisconsin, ²Inception Health Labs, Medical College of Wisconsin

필기록

우리의 연구는 암 치료에서 다양한 기계 학습 및 대규모 언어 모델 응용 프로그램에 중점을 둡니다. 여기에는 직접 환자 치료를 개선하고 일정 및 문서화와 같은 운영 문제를 해결하는 것이 모두 포함됩니다. 우리는 궁극적으로 이러한 기술이 어떻게 환자, 제공자 및 연구자를 위해 더 나은 의료 서비스를 제공할 수 있는지에 대한 질문에 답하려고 합니다.

대규모 언어 모델은 이미 연구 환경을 변화시키기 시작했습니다. 이전에는 불가능했던 자연어 처리 작업에 더 많은 연구자가 접근할 수 있게 되어 비정형 데이터와 관련된 많은 새로운 연구 분야가 가능해졌습니다. 주요 과제는 대규모 언어 모델 도구 및 인프라의 빠르게 변화하는 환경입니다.

많은 임상의와 연구자가 응용 분야에 대한 아이디어를 가지고 있을 수 있지만 현재 구현에 필요한 컨텍스트 또는 기술 지식이 없거나 다양한 접근 방식의 절충점에 대한 신중한 고려가 없습니다. 시작하려면 컴퓨터에 Git, python 및 PIP를 설치하고 터미널에서 명령을 실행하여 설치를 확인합니다. 그런 다음 git clone 명령을 실행하여 리포지토리를 다운로드하고 필요한 요구 사항을 설치합니다.

벡터 데이터베이스를 만들려면 구성을 편집합니다. py 파일, 다음 변수의 값을 큰 언어 모델을 보강하는 데 사용할 문서가 포함된 폴더의 파일 경로로 바꿉니다. 그런 다음 업데이트된 파일을 articles 디렉토리에 저장합니다.

다음으로, 동일한 디렉터리의 터미널에서 Python 3 build index 명령으로 코드를 실행하여 데이터베이스를 만들고 유지합니다. 이제 데이터베이스가 벡터 데이터베이스 폴더에 저장되었는지 확인합니다. 증강 LLM을 쿼리하려면 Python 3 run augmented llm을 실행합니다.

py 명령을 실행합니다. 사용자 쿼리를 테스트하여 문서 집합의 데이터로 보강된 응답을 받습니다. 그런 다음 control과 C를 눌러 완료되면 종료합니다.

MCQ를 만들려면 파일 질문을 편집합니다. py, 예제의 형식을 기록해 둡니다. 비슷한 형식으로 질문을 추가하고 파일을 저장합니다.

구성을 편집합니다. pi 파일에 개방형 AI 또는 포옹 얼굴에 대한 API 키를 추가합니다. 두 공급자 중 하나의 모델에 대해 벤치마킹하는 것이 목표인 경우.

이제 파일을 저장하십시오. 그런 다음 비교 llms를 편집합니다. py 파일을 열고 테스트할 모델 세트를 선택합니다.

비교할 모델의 주석 처리를 제거한 후. 마지막으로, 터미널에서 compare llms 명령으로 코드를 실행하고 실행 후 채점 또는 기타 검토를 위해 지정된 폴더에서 모델 응답을 봅니다. 테스트된 MCQ 중 임베드 모델은 증강 개방형 AI 모델과 마찬가지로 기본 모델보다 훨씬 더 나은 성능을 보였습니다.

요약

더 많은 비디오 탐색

Foundation Models

Peer reviewed Manuscripts

Open source Tools

Model Performance Evaluation

Specialized Domains

Training Corpus

이 비디오의 챕터

0:00

Introduction

0:58

Integrating Domain‐Specific Knowledge into Large Language Models Using Embeddings: An Approach Leveraging Llama‐Index and Llama‐2

관련 동영상

article

언어 학습 및 단어 습득 연구에서 베르니케와 브로카의 경두개 직접 전류 자극 (tDCS)

16.7K Views

article

치매 또는 경도 인지 장애가 있거나 없는 성인에서 서면 단어 인식을 연구하기위한 어휘 결정 작업

9.1K Views

article

이벤트 관련 전위 분석을 사용하여 표현 음성에서 강력한 음성 정체성 인식을 위한 암기 기반 교육 및 테스트 패러다임

1.4K Views

article

이벤트 관련 전위 분석을 사용하여 표현 음성에서 강력한 음성 정체성 인식을 위한 암기 기반 교육 및 테스트 패러다임

1.4K Views

article

이벤트 관련 전위 분석을 사용하여 표현 음성에서 강력한 음성 정체성 인식을 위한 암기 기반 교육 및 테스트 패러다임

1.4K Views

article

Foreign Accent and Forensic Speaker Identification in Voice Lineups: The Influence of Acoustic Features Based on Prosody

385 Views

article

복잡한 환경에서 두드러진 물체 감지를 위한 End-to-End Deep Neural Network

449 Views

article

복잡한 환경에서 두드러진 물체 감지를 위한 End-to-End Deep Neural Network

449 Views

article

복잡한 환경에서 두드러진 물체 감지를 위한 End-to-End Deep Neural Network

449 Views

article

재조합 아데노 - 관련 바이러스 성 벡터의 정위 주사를 통해 파킨슨 병에 대한 알파 - 시누 클레인 기반 쥐 모델 개발

13.2K Views

Copyright © 2025 MyJoVE Corporation. 판권 소유