SHARE

COMMENT

VOICE_COMMENT

COMMENT_PIN_OPERATION

MUTE_COMMENT_AUTHOR

DELETE

对的，我自己也看了技术报告，不过听一遍也感觉蛮有收获啊̋(ˊ•͈ꇴ•͈ˋ)

准确率70%，时延3秒，声音复刻，都是痛点

字节Seed 团队刚刚发布的端到端同声传译大模型，准确率70%，时延在3秒以内。未来应该是翻译耳机和跨语言视频会议的标配。
Seed LiveInterpret 2.0 技术报告已公布，模型基于火山引擎对外开放，Ola Friend 耳机也将在 8 月底接入 Seed LiveInterpret 2.0，成为首个支持该模型的智能硬件设备。
技术报告：arxiv.org
项目主页：seed.bytedance.com

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

David的AI全景图

jeusmypower

David的开源学习笔记和自制狗粮

AI_SUMMARIZE_EPISODE

聊聊字节Seed的同声传译大模型

6817326667bb8cf522f22b32/lkNdsxCSoH_s3FaBShHXrWGjJHNE.m4a