国产软硬件协同适配,如DeepSeek、千问、文心一言等优质模型大规 件协同优化,部分参测国产芯片部署DeepSeekR1模型的精度已基 本与国外系统持平(对比DeepSeek官方技术报告,基于英伟达H800 芯片),已能够满足实际产业应用需求。 (三)数据集建设转向适量高质,数据工程体系加速成型 高质量和体系化的数据集是驱动模型能力提升的“燃料”。随着 模型训练进入深水区,数据集建设正经历深刻变革。一方面,数据需 求持续攀升,但单纯堆砌数据量的方式已难以为继,数据训练密度和 利用效率成为新焦点;另一方面,数据集建设重点从追求规模转向质 量跃升,智能生成、专业细分、合规治理推动破解数据瓶颈。面向人工