11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
复旦大学与美团研究者提出UniToken框架,首次在统一模型中实现图文理解与生成任务的"双优表现"。该方案融合连续和离散视觉编码,有效解决了传统多模态建模中的"任务干扰"和"表示割裂"问题。通过三阶段训练策略(视觉语义对齐、多任务联合训练、指令强化微调),UniToken在多个基准测试中性能超越专用模型。其创新性体现在:1)统一的双边视觉编码
【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�
快科技4月17日消息,据报道,今日,在火山引擎AI创新巡展杭州站的现场,字节跳动旗下火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出,豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中,它能够精准高效地处理复杂问题;在创意写作等通用任务方面,同样表现出色。该模型采用MoE架构,总参数为200B,激�
OpenAI近期推出的全新图像生成工具引发了热潮,用户使用ChatGPT即可创作出吉卜力等风格的AI艺术作品。这一功能不仅推动了ChatGPT用户数的创新高导致服务器负担过重,甚至一度限制了该功能的使用。SensorTower的数据显示,ChatGPT应用的全球下载量和每周活跃用户数分别较上周增长了11%和5%应用内购买收入则增加了6%。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱发布Agent产品AutoGLM沉思:首个实现边想边干的智能体智谱AI在2025中关村论坛上发布了其最新的Agent产品——AutoGLM沉思。公司致力于推动具身智能技术的发展,特别是在机器人领域的创新,标志着其在全球市场中的竞争力不断增强。
更新上线仅三天,ChatGPT-4o的图像生成功能,就被网友们玩坏了。ChatGPT-4o的图像生成功能在社交平台上爆红,使用需求远高于预期。GPT-4o还能生成图像中的文字,此前这是图像生成领域的一大难题。
OpenAI创始人兼CEO萨姆�阿尔特曼直播发布了GPT-4o图像生成功能,作为多模态模型的GPT-4o补齐了图片生成这一重要拼图。GPT-4o图像生成可以遵循指令生成更准确的图像,OpenAI还为其挂载了固有知识库,可以根据知识库或上下文帮用户生成、编辑图像。文心一言生成的4张图片之一豆包生成的4张图片之一目前看来是有些差距。
GPTBots.ai,领先的企业级AI智能体平台,近日宣布将DeepSeek的Janus-Pro作为开放工具集成至其生态系统中,进一步扩展其全面的AI能力。此次集成紧跟在DeepSeekR1大语言模型加入之后,进一步强化了GPTBots.ai在为企业提供尖端AI解决方案领域的领先地位。凭借与各种系统的无缝集成以及对可扩展、安全部署的支持,GPTBots致力于降低成本、加速增长,并帮助企业在AI时代中蓬勃发展。
图像、音乐能用AI生成,但出乎意料的是,气味也行。一个名叫Osmo的初创公司宣布,他们成功地将气味数字化了。我们在体检时会有一个AI通过它的机器鼻子来判断我们的健康状况。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、InstantX图像生成黑科技!微软使用了OpenAI的GPT-4o进行开发,但系统与大型语言模型无关,推荐使用强大的推理模型作为指挥者智能体。