首页 > 业界 > 关键词  > Gemini最新资讯  > 正文

今日AI:Gemini Pro1.5向所有人开放;Stable Diffusion核心团队集体离职;HeyGen5.0上线视频翻译功能;剪映内测视频翻译功能

2024-03-22 16:02 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240322161437.png

🤖📱💼AI应用

Gemini Pro1.5及其百万上下文功能现已向所有人开放

QQ截图20240322154001.png

【AiBase提要:】

⭐ Gemini Pro1.5加入视频模态的长上下文功能,AI可以处理更复杂的视频内容。

⭐ 博主体验Gemini Pro1.5后表示,描述准确且清晰,展示强大处理能力。

⭐ Gemini Pro1.5百万上下文功能的开放将推动AI领域发展,为用户带来更丰富体验。

体验地址:https://top.aibase.com/tool/google-ai-studio

Suno正式发布V3音乐生成模型 所有人都可用

image.png

【AiBase提要:】

⭐ 音质得到显著提升,带来更清晰动听音频体验。

⭐ V3提供更丰富音乐风格选择,满足不同需求。

⭐ 用户指令响应显著改进,确保音乐结尾流畅自然。

官网地址:https://top.aibase.com/tool/suno-ai

剪映内测视频翻译功能仅限移动端体验

【AiBase提要:】

🚀剪映推出全新视频翻译功能,进一步巩固其领先地位。

📱内测仅限移动端体验,审批速度较快,可在短时间获得资格

🔒视频翻译功能仅支持用户本人视频,需声音认证。

内测申请地址:https://bytedance.larkoffice.com/share/base/form/shrcnq7rM9EEJytIW5LKyUpVaee

HeyGen发布5.0版本上线实时数字人聊天和视频翻译功能

QQ截图20240322100113.png

【AiBase提要:】

⭐全新用户界面设计,更容易找到想要使用的功能

⭐引入全新视频编辑工作室,编辑更加灵活

⭐上线实时数字人聊天功能,视频翻译等功能

产品入口:https://top.aibase.com/tool/heygen-5-0

零一万物API开放 多模态中文图表体验超越GPT-4V

【AiBase提要:】

⭐️ 零一万物API正式开放,包含三款强大模型,支持通用聊天、多文档阅读理解等功能。

⭐️ 多模态模型Yi-VL-Plus中文图表体验超越GPT-4V,支持图表识别、信息提取、问答和推理。

⭐️ Yi-34B-Chat-200K模型开放,准确率高达99.8%,用于长文本理解、小说内容总结和论文要点提取。

地址:https://platform.lingyiwanwu.com/playground

视频转视频框架AnyV2V 可修改源视频主题、风格等

QQ截图20240322150433.png

【AiBase提要:】

⭐️ 支持对源视频进行深度修改,加入文本提示、主题或风格

⭐️ 核心目标是简化视频编辑为两个步骤

⭐️ 整合各种图像编辑工具,实现新视频生成外观和动作与原视频保持一致

论文地址:https://arxiv.org/html/2403.14468v1#S6

MIT研究员推新AI图片生成框架DMD:AI 单步生成高质量图像 速度快30倍

image.png

【AiBase提要:】

⭐️ MIT研究人员开发了比传统扩散模型快30倍的单步AI图像生成器,质量仍高。

⭐️ 新方法结合了教师 - 学生模型,通过匹配蒸馏实现单步图像生成。

⭐️ 框架加速了图像生成,潜在益处涉及设计工具、药物发现和3D建模等领域。

论文网址:https://arxiv.org/abs/2311.18828

微软NaturalSpeech语音合成推出第三代 生成语音更自然了

【AiBase提要:】

⭐️ NaturalSpeech3采用属性分解扩散模型和数据/模型扩展,提高语音合成质量和自然度

⭐️ FACodec和属性分解扩散模型是NaturalSpeech3的关键技术

⭐️ NaturalSpeech3在语音质量、相似性、韵律和可懂度方面超越了现有TTS系统

论文:https://arxiv.org/abs/2403.03100

Demo 演示: https://speechresearch.github.io/naturalspeech3

📰🤖📢AI新鲜事

开源AI掌机01Light爆火,让远程操控电脑变得触手可及

image.png

【AiBase提要:】

⭐01Light能够识别屏幕内容学习用户习惯,提供个性化需求满足。

⭐ 用户按下按钮讲话,01Light思考回应需求,实现远程语音控制电脑操作。

⭐ 完全开源的01Light能提高工作效率,节省时间,随时随地操控电脑。

官网:https://top.aibase.com/tool/01-light

项目地址:https://github.com/OpenInterpreter/01

Stable Diffusion核心团队集体离职 AI巨头Stability AI面临财务危机

【AiBase提要:】

⭐️ Stable Diffusion核心团队集体离职,引发科技界广泛关注。

⭐️ Stability AI可能因财务困境挑战,团队领导离职名单中。

⭐️ Stable Diffusion项目开源成功,但给公司商业模式带来挑战。

百度5款大模型上新,更小更便宜!还可1分钟零代码打造Agent应用

image.png

【AiBase提要】

⭐ 做一个“英语作文批改小帮手”应用,只需在AppBuilder中输入应用名称或功能,平台即可生成应用。

⭐ 百度推出5款大模型,轻量化、性价比更高,适用于各种场景下的Agent应用。

⭐ 千帆AppBuilder升级,支持一键分发到多个主流渠道,加入新的基础组件如向量数据库VDB1.0。

产品入口:https://top.aibase.com/tool/baiduzhinengyunqianfanappbuilder

微软将以6.5亿美元收购Inflection AI 获得后者大模型的使用权

【AiBase提要:】

⭐ 微软同意支付6.5亿美元收购Inflection AI,获取大模型使用权。

⭐ 微软将雇佣Inflection AI大部分员工,包括联合创始人。

⭐ Inflection-2.5是Inflection最新人工智能模型,性能接近GPT-4。

中国首部AI全流程微短剧《中国神话》启播 央视频AI频道上线

【AiBase提要:】

🎬 央视频推出全流程AI微短剧《中国神话》,六集展现经典神话故事。

📺 央视频AI频道正式上线,推动视听产业创新升级。

🤖 AI技术应用助力央视频推动中国传媒业发展。

月入25万,批量AI美女,收割中年男人的钱包

图片

【AiBase提要:】

⭐ 中年男人愿意花钱,AI美女们抓住了这一商机。

⭐ AI美女主播以低单价产品吸引中老年男性用户,通过带货视频获利丰厚,受欢迎程度高。

⭐ AI带货产业链庞大,但也存在虚假宣传和维权问题。

案例:https://www.chinaz.com/2024/0322/1605183.shtml

————

今日Midjourney提示词:淘宝服装模特

2_1711094141451_ai2023_A_beautiful_Chinese_female_model_wearing_round_framed_gl_d73a8207-946d-4c83-9eb6-648463f7d7b5.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A beautiful Chinese female model wearing round framed glasses, with a delicate Asian face, wearing a light gray linen short sleeved shirt and Short pants, Japanese style shirt ,hands in pockets, front view, and a beige background,full bodyshot, Studio lighting, soho, shot on Canon EOS5D Mark IV ,8k --ar3:4--v6.0

举报

  • 相关推荐
  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • 谷歌透露Gemini每次回答消耗能量:相当于微波炉运行1秒钟

    近日,谷歌发布了一份技术报告,详细说明了其Gemini大模型在每次查询中消耗的能源量。 据谷歌介绍,这是迄今为止大型人工智能公司发布的最透明估算,也是研究人员期待已久的报告。 报告称,Gemini应用的文字回答平均每次消耗0.24瓦特小时(Wh)的能量,大约相当于运行微波炉一秒钟,并排放0.03克二氧化碳当量。 据此前媒体报道,谷歌近日发布Gemini系列最轻量版本Gemma 3

  • 豆包1.5轻量版 vs Gemini 2.5闪存版:生成5000字深度文章,哪个模型更合适?

    AIbase选型工具通过多维度数据对比,帮助用户精准选择AI模型。文章以豆包和Gemini为例,展示平台如何解决模型选型痛点:自动生成对比报告,评估关键指标如术语准确性、本土案例适配度等。实际案例显示,使用该工具后内容团队效率提升40%,编辑成本下降65%。核心价值在于用数据驱动决策,规避局部优势导致的全局误判,实现场景化精准匹配。

  • Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比:谁在性价比上更胜一筹?

    面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • Google Gemini vs Deepseek:谁更适合你的业务场景?AI大模型选型终极对比指南

    企业在选择大模型时面临两难:国际大厂的Gemini技术先进,但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出:1)跨境电商客服场景中,Gemini多语言识别准确率提升12%,但需注意API延迟问题;2)金融研报分析场景下,DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键:抛开参数迷雾,聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具,3分钟生成专属选型报告,让技术决策不再玄学。

  • AI大模型选型决策指南:10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

    本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个,但选型面临三大难题:单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法:1)场景刚需筛选80%选项;2)验证核心性能;3)评估边际效益。以Gemini和DeepSeek为例,前者适合常规FAQ场景年省$16,000,后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系,将3小时选型会议压缩至18分钟,错误率下降40%。核心观点:选型应从参数争论转向场景验证,通过自动化工具为工程师节省时间,聚焦提示词优化而非参数对比。

  • 34Q9 垂直整合重塑 Mini LED 格局

    2025年9月1日,雷鸟推出34Q9 Mini LED电竞显示器,定价3999元。该产品采用2304分区Mini LED背光和HVA面板,实现1ms响应速度和4000:1对比度,精准切入3000-4000元市场空档。凭借华星光电供应链优势,产品在画质、色域(97% DCI-P3)及多设备兼容性(90W Type-C)上表现突出,覆盖电竞玩家、内容创作者和多设备用户三大群体。业界认为该产品可能重塑中高端显示器市场格局,加速Mini LED技术普及。

今日大家都在搜的词: