我们的研究重点是癌症护理中的各种机器学习和大型语言模型应用。这包括改善直接患者护理和解决运营挑战,例如日程安排和文档记录。我们最终试图回答这个问题,这些技术如何为患者、提供者和研究人员提供更好的医疗保健服务?
大型语言模型已经开始改变研究领域。以前令人望而却步的自然语言处理任务已经为更多的研究人员所接受,从而使许多涉及非结构化数据的新研究成为可能。一个主要挑战是大型语言模型工具和基础设施的快速变化。
许多临床医生和研究人员可能对应用程序有想法,但目前不具备实施所需的上下文或技术知识,也不具备对不同方法的权衡的深思熟虑。要开始在计算机上安装 Git、python 和 PIP,请在终端中运行命令以验证安装。然后运行 git clone 命令下载存储库并安装必要的要求。
要创建矢量数据库,请编辑配置。py 文件,将以下变量的值替换为包含将用于扩充大型语言模型的文档的文件夹的文件路径。然后将更新后的文件保存在 articles 目录中。
接下来,在同一目录中的终端中,使用 Python 3 build index 命令执行代码以创建和持久化数据库。验证数据库现在是否保存在 vector 数据库文件夹中。要查询增强的 LLM,请执行 Python 3 run augmented llm。
py 命令。测试用户查询以接收由文档集中的数据扩充的响应。完成后按 control 加 C 退出。
要创建 MCQ,请编辑文件问题。py,并记下示例的格式。按照类似的格式添加问题,然后保存文件。
编辑配置。pi 文件中,添加 open AI 或 hugging face 的 API key。如果目标是与来自任一提供商的模型进行基准测试。
现在保存文件。然后编辑 compare llms。py 文件,然后选择要测试的模型集。
取消注释要比较的模型后。最后,在终端中,使用 compare llms 命令执行代码,执行后查看指定文件夹中的模型响应,以便进行评分或其他审查。在测试的 MCQ 中,嵌入模型的表现明显优于基础模型,增强的开放 AI 模型也是如此。