Talaria:以交互方式优化机器学习模型,实现高效推理
苹果机器学习研究团队开发了一种名为Talaria的系统,旨在帮助从业者优化机器学习模型,使其在设备上高效运行。随着计算从云端移至个人设备,用户隐私得以保护,同时也能提供智能用户体验。但在资源有限的设备上运行模型仍是一个技术难题,需要平衡模型大小、延迟和功耗等硬件指标。
为了应对这一挑战,Talaria提供了以下功能:
- 模型可视化:从业者可以互动式地查看模型统计数据。
- 硬件编译:Talaria支持将模型编译到特定硬件上。
- 优化模拟:从业者可以模拟优化方案,测试其对推理指标的影响。
自两年前内部部署以来,Talaria已被广泛使用。评估结果显示:
- 日志分析:800多名从业者提交了3600多个模型。
- 用户调查:26名用户评价了Talaria的20项功能。
- 定性访谈:与7位最活跃用户进行的深入访谈,探讨了他们的使用体验。
此外,Talaria还在2024年的CHI会议上获得了最佳论文荣誉提名。