返回行业动态

基于AMD ROCm平台微调临床AI模型MedQA,全程无需CUDA依赖

2026/05/08 07:56
查看原文

OmniTools 5月8日消息,5月8日消息,研究人员基于AMD Instinct MI300X GPU与ROCm平台,成功完成临床问答模型MedQA的LoRA微调,全程无需CUDA依赖。该项目以Qwen3-1.7B为基座模型,在MedMCQA数据集的2000个样本上训练约5分钟,仅更新约223万参数(占比0.15%),全程采用fp16精度且未使用量化技术。

MedQA模型可对医学多选题输出答案及临床推理过程。项目验证了Hugging Face生态(Transformers、PEFT等)在ROCm 6.1上的开箱即用兼容性,仅需配置环境变量即可无缝迁移原CUDA代码。MI300X的192GB HBM3显存有效避免了量化带来的精度损耗。模型适配器已开源至Hugging Face Hub,并提供在线演示。