首页 > 业界 > 关键词  > Gemma最新资讯  > 正文

AI视野:谷歌开源小参数大模型Gemma;李一舟AI课程小程序因违规被暂停服务;Sora AI视频生成器模板sorafm开源;字节跳动开发 SDXL-Lightning

2024-02-22 15:47 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240222160622.png

🤖📱💼AI应用

谷歌开源Gemma:参数小、性能超越Llama2,可轻松在笔记本上运行

图片

【AiBase提要:】

⭐ Gemma采用Gemini架构,有20亿、70亿两个版本,性能强悍。

⭐ Gemma支持普通笔记本、台式机运行,无需庞大AI算力。

⭐ Gemma优化跨框架、设备、硬件,与NVIDIA合作,适用于Google Cloud。

项目入口网址:https://top.aibase.com/tool/gemma

比DOMOAI还原能力更强!GoEnhance AI视频转绘更稳定更流畅

【AiBase提要:】

⭐️ 可以将视频转换成多种不同风格的视频

⭐️ 视频转绘更稳定流畅

⭐️ 更强的还原度,碾压DOMOAI

官网地址:https://top.aibase.com/tool/goenhance-ai

开发者开源Sora AI视频生成器模板sorafm

image.png

【AiBase提要:】

⭐ Sora火爆但未正式开放,开发者着手开源项目。

⭐ sora.fm是一个全栈开发的Sora AI视频生成器模板。

⭐ 开发者计划建立Sora Showcase网站,吸引流量提前上线。

网页:https://top.aibase.com/tool/sora-ai-video-generator

项目地址:https://github.com/all-in-aigc/sorafm

腾讯会议AI小助手上线 基于“混元”大模型打造

【AiBase提要:】

⭐ 腾讯会议AI小助手全面覆盖会议各环节,提升效率和信息流转速度。

⭐ 实时生成会议纪要,智能提炼讨论内容,高效明确工作方向。

⭐ 基于腾讯自研的大语言模型“混元”,具备强大技术支撑。

SDXL-Lightning:一个步骤就能生成1024分辨率高清图像

image.png

【AiBase提要:】

⭐️ SDXL-Lightning项目由字节跳动开发,采用创新蒸馏策略。

⭐️ 通过渐进式蒸馏和对抗式蒸馏解决生成速度和质量问题。

⭐️ SDXL-Lightning模型开源支持LoRA版本和UNet权重版本。

模型地址:https://top.aibase.com/tool/sdxl-lightning

PixelPlayer:能自动从视频中识别和分离不同的声音源

image.png

【AiBase提要:】

⭐ 自动识别视频中不同声音源

⭐ 分离声音并与视频位置匹配

⭐ 核心功能包括声音源分离、声音定位和多声音源处理

项目地址:https://top.aibase.com/tool/pixelplayer

📰🤖📢AI新鲜事

李一舟AI课程小程序因违规被暂停服务199元人工智能课已被下架

【AiBase提要】

⭐️ 微信小程序“一舟一课”因违规被暂停服务

⭐️199元的人工智能课已被下架

⭐️ 李一舟通过AI课程在3年内的收入超过亿元

谷歌紧急修复Gemini AI图片生成,因生成作品种族歧视问题

【AiBase提要:】

🤖 谷歌赶紧修复新的AI工具,避免被指责过于防止种族歧视

🌐 AI在多样性问题上的失误引发了争议

🔧 谷歌Gemini AI生成图像存在种族歧视问题,公司紧急修复

疯狂发力!谷歌将Gemini集成到Gmail、Docs等企业工具

【AiBase提要:】

⭐️ 谷歌推出面向企业的AI工具,Gemini模型提供支持,降低价格与微软竞争。

⭐️ Gemini将集成在Google Workspace的应用中,每月20-30美元不等。

⭐️ 谷歌表示将推出独立的聊天体验“Chat with Gemini”,对话不用于广告目的。

AI美女,组团在抖音卖货

图片

【AiBase提要:】

⭐ AI种草博主通过AI生成内容,在抖音带货赚取佣金。

⭐ 视频内容简陋,但流量不差,带货路径已经跑通。

⭐ 难点在于账号运营,需要注意避免触犯法律法规。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

【AiBase提要:】

⭐ 蒋路是谷歌VideoPoet项目负责人,加入TikTok,研发视频模型对抗Sora。

⭐ VideoPoet在技术上与Sora相似,生成10秒视频,是AI视频生成领域领先者。

⭐ 蒋路拥有丰富科研经历,曾在谷歌和CMU任职,是大厂必争的AI基石型人才。

举报

  • 相关推荐
  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 格创东智CIM AI Insight实现“数据追人”,产能决策时间压缩90%

    半导体制造面临数据迷雾困境:晶圆生产涉及上千道精密工序,良率波动0.1%即可能造成千万级损失。传统数据分析依赖人工跨系统提取数据,效率低下且难实时联动。格创东智推出CIM+AI+Insight解决方案,通过自然语言交互、多智能体协作和动态仪表板三大创新,实现"数据找人"的智能化转型。该系统具备三大核心价值:1)自然语言查询替代SQL编写;2)ChatYMS等智能体自�

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • 字节跳动公布核心人才观 称用人看潜力不看资历

    昨日,字节跳动公布六大人才观。字节跳动表示,自创业之初便坚信人才是公司成功的关键要素,秉持“和优秀的人,做有挑战的事”的理念吸引众多人才加入。 公司认为,随着业务复杂度提升,保持优秀人才密度大于业务复杂度是组织有效运行的关键,更倾向于通过优秀人才的创新意愿和能力来应对挑战,而非单纯依赖增加规则和管理措施。 字节跳动鼓励人才在工作中大�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 字节跳动警告合作方 对腐败贿赂员工零容忍

    字节跳动发布端午合规提示,明确对腐败贿赂行为零容忍。文件规定:合作方若向员工行贿或谋取不当利益,将被永久列入黑名单;节日期间禁止赠送粽子礼盒、现金红包等礼品;不得提供高档餐饮娱乐招待。2024年公司已辞退353名违规员工,其中39人移送司法机关。此举彰显字节跳动反腐决心,旨在维护廉洁透明的商业合作环境。(140字)