우리의 연구는 암 치료에서 다양한 기계 학습 및 대규모 언어 모델 응용 프로그램에 중점을 둡니다. 여기에는 직접 환자 치료를 개선하고 일정 및 문서화와 같은 운영 문제를 해결하는 것이 모두 포함됩니다. 우리는 궁극적으로 이러한 기술이 어떻게 환자, 제공자 및 연구자를 위해 더 나은 의료 서비스를 제공할 수 있는지에 대한 질문에 답하려고 합니다.
대규모 언어 모델은 이미 연구 환경을 변화시키기 시작했습니다. 이전에는 불가능했던 자연어 처리 작업에 더 많은 연구자가 접근할 수 있게 되어 비정형 데이터와 관련된 많은 새로운 연구 분야가 가능해졌습니다. 주요 과제는 대규모 언어 모델 도구 및 인프라의 빠르게 변화하는 환경입니다.
많은 임상의와 연구자가 응용 분야에 대한 아이디어를 가지고 있을 수 있지만 현재 구현에 필요한 컨텍스트 또는 기술 지식이 없거나 다양한 접근 방식의 절충점에 대한 신중한 고려가 없습니다. 시작하려면 컴퓨터에 Git, python 및 PIP를 설치하고 터미널에서 명령을 실행하여 설치를 확인합니다. 그런 다음 git clone 명령을 실행하여 리포지토리를 다운로드하고 필요한 요구 사항을 설치합니다.
벡터 데이터베이스를 만들려면 구성을 편집합니다. py 파일, 다음 변수의 값을 큰 언어 모델을 보강하는 데 사용할 문서가 포함된 폴더의 파일 경로로 바꿉니다. 그런 다음 업데이트된 파일을 articles 디렉토리에 저장합니다.
다음으로, 동일한 디렉터리의 터미널에서 Python 3 build index 명령으로 코드를 실행하여 데이터베이스를 만들고 유지합니다. 이제 데이터베이스가 벡터 데이터베이스 폴더에 저장되었는지 확인합니다. 증강 LLM을 쿼리하려면 Python 3 run augmented llm을 실행합니다.
py 명령을 실행합니다. 사용자 쿼리를 테스트하여 문서 집합의 데이터로 보강된 응답을 받습니다. 그런 다음 control과 C를 눌러 완료되면 종료합니다.
MCQ를 만들려면 파일 질문을 편집합니다. py, 예제의 형식을 기록해 둡니다. 비슷한 형식으로 질문을 추가하고 파일을 저장합니다.
구성을 편집합니다. pi 파일에 개방형 AI 또는 포옹 얼굴에 대한 API 키를 추가합니다. 두 공급자 중 하나의 모델에 대해 벤치마킹하는 것이 목표인 경우.
이제 파일을 저장하십시오. 그런 다음 비교 llms를 편집합니다. py 파일을 열고 테스트할 모델 세트를 선택합니다.
비교할 모델의 주석 처리를 제거한 후. 마지막으로, 터미널에서 compare llms 명령으로 코드를 실행하고 실행 후 채점 또는 기타 검토를 위해 지정된 폴더에서 모델 응답을 봅니다. 테스트된 MCQ 중 임베드 모델은 증강 개방형 AI 모델과 마찬가지로 기본 모델보다 훨씬 더 나은 성능을 보였습니다.