基于AMD ROCm平台微调临床AI模型MedQA，全程无需CUDA依赖

OmniTools 5月8日消息，5月8日消息，研究人员基于AMD Instinct MI300X GPU与ROCm平台，成功完成临床问答模型MedQA的LoRA微调，全程无需CUDA依赖。该项目以Qwen3-1.7B为基座模型，在MedMCQA数据集的2000个样本上训练约5分钟，仅更新约223万参数（占比0.15%），全程采用fp16精度且未使用量化技术。

MedQA模型可对医学多选题输出答案及临床推理过程。项目验证了Hugging Face生态（Transformers、PEFT等）在ROCm 6.1上的开箱即用兼容性，仅需配置环境变量即可无缝迁移原CUDA代码。MI300X的192GB HBM3显存有效避免了量化带来的精度损耗。模型适配器已开源至Hugging Face Hub，并提供在线演示。