本期的 4 篇论文如下:
00:27 🖼 How Well Does GPT-4o Understand Vision? Evaluating Multimodal Foundation Models on Standard Computer Vision Tasks(GPT-4o的视觉理解能力如何?在标准计算机视觉任务上评估多模态基础模型)
01:09 🌌 Lost in Latent Space: An Empirical Study of Latent Diffusion Models for Physics Emulation(迷失于潜在空间:用于物理模拟的潜在扩散模型实证研究)
01:45 🇮 Eka-Eval : A Comprehensive Evaluation Framework for Large Language Models in Indian Languages(Eka-Eval:一个用于印度语言大型语言模型的综合评估框架)
02:25 ✍ LitBench: A Benchmark and Dataset for Reliable Evaluation of Creative Writing(LitBench:创意写作可靠评估的基准和数据集)

【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递