- 字节跳动推出新视频生成模型:PixelDance与Seaweed
在11月15日,字节跳动发布了两款视频生成模型PixelDance和Seaweed,用户可免费体验。PixelDance适合复杂剧情创作,支持多镜头切换,而Seaweed则在图生视频场景中保持高一致性。这些模型经过多次迭代,旨在服务专业创作者和艺术家,广泛应用于设计、影视和动画领域。即梦AI平台还提供积分赠送,支持自然语言和图片输入,助力用户生成高质量内容。
- AIGC让CX Automation焕然一新
在本期《Lucy的AI投资笔记》中,上海女性创业者Lucy陈欣怡邀请自动化营销专家Patrick,深入探讨用户体验自动化(CX Automation)如何通过AI和大数据技术提升企业与客户之间的互动。两位嘉宾分享了CX Automation的创新应用、未来发展趋势以及对创业者和投资人的潜在机会,带领听众领略科技如何改变用户体验的精彩旅程。
- 合成数据:未来数据科学的革命性工具
自从成为VC EIR以来,我在过去的6个月中记录了超过60家中国大陆的创业团队发展情况,和围绕AIGC和新一代软件、数据方向的主题实践,简单说,我记录了他们是谁、他们在做什么以及他们干的如何。 其中的一些话题和内容,特别有趣,对我自己在AI上的认知有不同程度的New和Fresh的感受,但又受限于Confidential的问题不能直接分享。 于是,我进行了一个实验,我上传一篇笔记,并通过TTS生成一个AI播客与大家分享。 我的方法是: 1. 我将笔记导入Claude3.5 Sonnet V2,在确保重要案例和术语意义不变的情况下进行扩写。我在这个阶段,尝试了几个模型,GPT-4o的理解准确度和扩写修饰稍逊,Quwen的理解很到位,但文字修饰过于浓烈,仿佛在给文章穿上晚礼服,最终我选择了Claude。 2. 我创建了Lucy和Patrick两个角色,并输入问题大纲,让Claude围绕主要内容以双角色对话的方式重写。这部分耗时最多,因为提问不总是准确。后来我发现,如果在原始文件的第一次扩写处理时,底层纲要与问题纲要一致,就能更好地识别。就像在玩角色扮演游戏,只有剧情对上了,才能顺利通关。 3. 将“脚本”导入TTS中,我尝试了“Qanwen、Minimax和OpenAI-TTS1-HD”。因为主要是中文,我刚尝试时选择了大陆厂商的TTS模型,认为中文理解和表达能力会很好,但发现了一些有趣的现象,比如“Patrick Li”会被理解为“Patrick L/I”,一些英文术语被忽略。而OpenAI中文输出虽然意思正确,但语气和语调有些“洋腔洋调”。仿佛Patrick在用中文说:“我来自火星。” 无论如何,目前尝试的TTS还有提升空间,最终我选择了“OpenAI-TTS1-HD”,因为无法接受名字被单独念成“L”和“I”。想象一下,每次听到自己的名字都像在打字母游戏,实在是受不了。 以下你听到的所有内容皆由AI Agent生成,欢迎点赞、关注、评论和持续分享,让我们一起期待AI Agent的变化并感受科技。