AI视野：谷歌开源小参数大模型Gemma；李一舟AI课程小程序因违规被暂停服务；Sora AI视频生成器模板sorafm开源；字节跳动开发 SDXL-Lightning

2024-02-22 15:47 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

QQ截图20240222160622.png

🤖📱💼AI应用

谷歌开源Gemma:参数小、性能超越Llama2，可轻松在笔记本上运行

【AiBase提要:】
⭐ Gemma采用Gemini架构，有20亿、70亿两个版本，性能强悍。
⭐ Gemma支持普通笔记本、台式机运行，无需庞大AI算力。
⭐ Gemma优化跨框架、设备、硬件，与NVIDIA合作，适用于Google Cloud。
项目入口网址:https://top.aibase.com/tool/gemma

比DOMOAI还原能力更强!GoEnhance AI视频转绘更稳定更流畅

【AiBase提要:】
⭐️ 可以将视频转换成多种不同风格的视频
⭐️ 视频转绘更稳定流畅
⭐️ 更强的还原度，碾压DOMOAI
官网地址:https://top.aibase.com/tool/goenhance-ai

开发者开源Sora AI视频生成器模板sorafm

【AiBase提要:】
⭐ Sora火爆但未正式开放，开发者着手开源项目。
⭐ sora.fm是一个全栈开发的Sora AI视频生成器模板。
⭐ 开发者计划建立Sora Showcase网站，吸引流量提前上线。
网页:https://top.aibase.com/tool/sora-ai-video-generator
项目地址:https://github.com/all-in-aigc/sorafm

腾讯会议AI小助手上线基于“混元”大模型打造

【AiBase提要:】
⭐ 腾讯会议AI小助手全面覆盖会议各环节，提升效率和信息流转速度。
⭐ 实时生成会议纪要，智能提炼讨论内容，高效明确工作方向。
⭐ 基于腾讯自研的大语言模型“混元”，具备强大技术支撑。

SDXL-Lightning:一个步骤就能生成1024分辨率高清图像

【AiBase提要:】
⭐️ SDXL-Lightning项目由字节跳动开发，采用创新蒸馏策略。
⭐️ 通过渐进式蒸馏和对抗式蒸馏解决生成速度和质量问题。
⭐️ SDXL-Lightning模型开源支持LoRA版本和UNet权重版本。
模型地址:https://top.aibase.com/tool/sdxl-lightning

PixelPlayer:能自动从视频中识别和分离不同的声音源

【AiBase提要:】
⭐ 自动识别视频中不同声音源
⭐ 分离声音并与视频位置匹配
⭐ 核心功能包括声音源分离、声音定位和多声音源处理
项目地址:https://top.aibase.com/tool/pixelplayer

📰🤖📢AI新鲜事

李一舟AI课程小程序因违规被暂停服务199元人工智能课已被下架

【AiBase提要】
⭐️ 微信小程序“一舟一课”因违规被暂停服务
⭐️199元的人工智能课已被下架
⭐️ 李一舟通过AI课程在3年内的收入超过亿元

谷歌紧急修复Gemini AI图片生成，因生成作品种族歧视问题

【AiBase提要:】
🤖 谷歌赶紧修复新的AI工具，避免被指责过于防止种族歧视
🌐 AI在多样性问题上的失误引发了争议
🔧 谷歌Gemini AI生成图像存在种族歧视问题，公司紧急修复

疯狂发力!谷歌将Gemini集成到Gmail、Docs等企业工具

【AiBase提要:】
⭐️ 谷歌推出面向企业的AI工具，Gemini模型提供支持，降低价格与微软竞争。
⭐️ Gemini将集成在Google Workspace的应用中，每月20-30美元不等。
⭐️ 谷歌表示将推出独立的聊天体验“Chat with Gemini”，对话不用于广告目的。

AI美女，组团在抖音卖货

【AiBase提要:】
⭐ AI种草博主通过AI生成内容，在抖音带货赚取佣金。
⭐ 视频内容简陋，但流量不差，带货路径已经跑通。
⭐ 难点在于账号运营，需要注意避免触犯法律法规。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora，AI视频模型大战在即

【AiBase提要:】
⭐ 蒋路是谷歌VideoPoet项目负责人，加入TikTok，研发视频模型对抗Sora。
⭐ VideoPoet在技术上与Sora相似，生成10秒视频，是AI视频生成领域领先者。
⭐ 蒋路拥有丰富科研经历，曾在谷歌和CMU任职，是大厂必争的AI基石型人才。

（举报）

相关推荐

关键词：

Gemma

对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3，对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频，还能为人物对话、鸟鸣等场景自动匹配音效，实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户，月费249.99美元，并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是，谷歌在AI图像生成领域并非一帆风顺，此前Imagen 3曾因生成含历史错误的图像引发争议。

谷歌视频生成模型 Veo
必应引入OpenAI的Sora视频生成器，完全免费使用

微软表示：“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信，创造力应当轻松且人人可用，从而助力你的探索与表达。”

必应搜索微软搜索引擎 Sora视频模型
荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

本文介绍了AI领域最新动态：1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用；2)研究显示ChatGPT能提升K12学生成绩近87%；3)谷歌视频生成工具Veo3扩展至更多地区；4)谷歌发布三款Gemma模型变体，覆盖医疗、手语翻译和海豚语言研究；5)VideoTutor实现一句话生成定制教学视频；6)字节跳动开源多模态模型BAGEL；7)Rork支持无代码开发iOS/Android应用；8)AingDesk降低AI助手开发门槛；9)Claude4登陆亚马逊Bedrock平台；10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

人工智能移动办公 AI应用
荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

本文介绍了AI领域多项最新进展：1)B站团队推出开源动漫视频生成模型AniSora，支持多种风格创作；2)OpenAI发布编程智能体Codex，提升开发效率；3)Google测试AI问答功能AI Mode；4)ChatGPT将整合MCP协议，支持第三方AI服务对接；5)阿里推出ZeroSearch框架，减少对搜索引擎的依赖；6)Stability AI与Arm合作推出手机端音频生成AI；7)Qwen发布WorldPM系列大模型；8)GPT-5将整合多款产品功能；9)ListenHub上线AI播客生成工具；10)QQ浏览器升级为AI浏览器；11)数学建模AI助手MathModelAgent面世；12)GenSpark推出全球首个智能下载代理；13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

AI日报动漫视频生成 AniSora
荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

本文汇总了近期AI领域的重要动态：1)通义千问发布Qwen3-Embedding系列模型，在多语言文本处理表现优异；2)字节跳动推出图像编辑模型SeedEdit3.0，提升细节保持能力；3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha；4)Anthropic推出面向国家安全的Claude Gov模型；5)可灵AI月收入连续两月超1亿元；6)Meta公布智能眼镜Aria Gen2技术细节；7)爱诗科技上线AI视频工具"拍我AI"；8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

人工智能深度学习文本处理
格创东智CIM AI Insight实现“数据追人”，产能决策时间压缩90%

半导体制造面临数据迷雾困境：晶圆生产涉及上千道精密工序，良率波动0.1%即可能造成千万级损失。传统数据分析依赖人工跨系统提取数据，效率低下且难实时联动。格创东智推出CIM+AI+Insight解决方案，通过自然语言交互、多智能体协作和动态仪表板三大创新，实现"数据找人"的智能化转型。该系统具备三大核心价值：1）自然语言查询替代SQL编写；2）ChatYMS等智能体自�

格创东智数据分析良率优化
荐AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

本期AI日报聚焦多项AI领域突破：1)DeepSeek发布R1-0528模型，支持128K上下文且性能媲美GPT-4；2)字节推出"小云雀AI"图像创作工具；3)可画2.1版本价格降65%性能提升；4)Opera发布全球首款AI浏览器Neon；5)Meta推出多模态空间理解模型；6)北大团队研发ZeroSearch框架降低大模型训练成本88%；7)字节推出AI视频剪辑应用"剪小映"；8)MotionPro实现40ms/帧精准视频控制；9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人；10)OpenAI重组架构为IPO铺路；11)像素蛋糕"方糖大模型"获国内首个影像行业备案；12)Paper2Poster实现论文自动转海报；13)Resemble AI开源TTS模型性能比肩ElevenLabs；14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

人工智能 AI产品技术趋势
字节跳动公布核心人才观称用人看潜力不看资历

昨日，字节跳动公布六大人才观。字节跳动表示，自创业之初便坚信人才是公司成功的关键要素，秉持“和优秀的人，做有挑战的事”的理念吸引众多人才加入。公司认为，随着业务复杂度提升，保持优秀人才密度大于业务复杂度是组织有效运行的关键，更倾向于通过优秀人才的创新意愿和能力来应对挑战，而非单纯依赖增加规则和管理措施。字节跳动鼓励人才在工作中大�

字节跳动人才观创新能力
荐一场文心大模型的「AI马拉松」

对于百度而言，既要保持长期主义的战略定力，也要在技术路径上灵活应变，这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年，模型能力的重要性依然无需多言。从预训练的角度来看，虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说，预训练数据即将用尽，但海量的图像、视频等多模态数据资源依然有待挖掘。从后训练的角度来看，强化学习新范式正�

AI发展模型能力预训练技术
字节跳动警告合作方对腐败贿赂员工零容忍

字节跳动发布端午合规提示，明确对腐败贿赂行为零容忍。文件规定：合作方若向员工行贿或谋取不当利益，将被永久列入黑名单；节日期间禁止赠送粽子礼盒、现金红包等礼品；不得提供高档餐饮娱乐招待。2024年公司已辞退353名违规员工，其中39人移送司法机关。此举彰显字节跳动反腐决心，旨在维护廉洁透明的商业合作环境。（140字）

字节跳动反腐倡廉商业合规

热文

3 天
7天

AI视野：谷歌开源小参数大模型Gemma；李一舟AI课程小程序因违规被暂停服务；Sora AI视频生成器模板sorafm开源；字节跳动开发 SDXL-Lightning

对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

必应引入OpenAI的Sora视频生成器，完全免费使用

荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

格创东智CIM AI Insight实现“数据追人”，产能决策时间压缩90%

荐AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

字节跳动公布核心人才观称用人看潜力不看资历

荐一场文心大模型的「AI马拉松」

字节跳动警告合作方对腐败贿赂员工零容忍

热文

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

李世石：AI不会“解读”……直觉依然属于人类！

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

站长商机