首页 > 业界 > 关键词  > Pika最新资讯  > 正文

AI日报:Pika 1.5又上线4个新;英伟达推超快AI图像生成模型Sana;Mistral AI推超强边缘AI模型Ministral 8B

2024-10-17 15:33 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Pika1.5重磅上线四个新特效:从粉碎到消失,效果炸裂了!

Pika1.5版本再度增加了四种新特效,让用户可以轻松生成炫酷动画。Pika Labs已吸引5500万美元投资,迅速积累50万用户。提供四种灵活的订阅计划,适应不同用户的需求。

【AiBase提要:】

🔥 Pika1.5版本新增四种新特效,包括粉碎、溶解、瘪掉和“ta-da”特效,让视频内容炫目多彩。

💰 Pika Labs吸引巨额投资,用户数量迅速增长,显示其受欢迎程度和市场潜力。

🎨 提供多样的订阅计划,满足用户不同的创作需求和经济实力。

详情链接:https://top.aibase.com/tool/pika

2、强!ChatGPT 月访问量突破31亿,首次超越必应搜索引擎!

在2024年9月,OpenAI的ChatGPT取得了里程碑式成就,其访问量首次超越微软必应搜索引擎。ChatGPT在全球和移动应用上的使用量显著增长,展现出稳定的增长趋势。OpenAI扩大了ChatGPT的免费服务,可能影响其未来盈利能力。

image.png

【AiBase提要:】

🌐 ChatGPT在2024年9月的全球访问量突破31亿次,首次超越必应搜索引擎。

📈 在美国,ChatGPT的访问量达到4.43亿次,显示持续增长趋势。

💡 OpenAI扩大了ChatGPT的免费服务,可能影响其未来盈利能力。

3、小红书下一个爆火玩法?Suno新功能Suno Scenes给你的“梗图”加分!

在日常生活中,我们经常拍摄有趣的照片和视频,但缺乏合适的音乐。Suno推出的新功能“Suno Scenes”解决了这一难题,用户可以上传照片或视频生成匹配氛围的歌曲,让照片和视频更生动有趣。

【AiBase提要:】

🎵 用户上传照片或视频即可生成匹配氛围的歌曲,提升作品趣味性。

📸 不仅适用于搞笑梗图和自拍视频,甚至随手拍的菜单照片也能生成适配音乐。

🎶 根据图片色调和文字信息匹配音乐风格,让用户产生特定旋律的感觉。

4、Mistral AI推超强边缘AI模型Ministral8B

Mistral AI最新推出的Ministral3B和Ministral8B语言模型专为边缘设备设计,支持高达128,000个token的上下文长度,适用于本地翻译、离线智能助手、数据分析和自主机器人等应用场景。性能优越,超越同类模型,定价合理且可通过API获取。未来将通过云合作伙伴上线,为AI应用提供更多可能性。

image.png

【AiBase提要:】

🚀 Mistral AI推出Ministral3B和8B,支持高达128,000个token的上下文长度。

💡 适合本地翻译、离线助手、数据分析和自主机器人等应用。

💰 定价合理,Ministral8B每百万token费用为0.10美元,Ministral3B为0.04美元。

5、比FLUX快100倍!英伟达联手MIT、清华推出超快AI图像生成模型Sana,笔记本也能秒速出图!

英伟达与麻省理工学院、清华大学合作开发的Sana框架能高效生成高达4096×4096分辨率的图像,且在笔记本电脑GPU上运行。Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。虽存在局限性,但Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。

image.png

【AiBase提要:】

🚀 Sana框架高效生成4096×4096分辨率图像,可在笔记本GPU上运行。

🔑 Sana-0.6B速度快、规模小,生成1024×1024分辨率图像不到1秒。

💡 Sana在4K图像生成方面性能优异,未来将构建高效视频生成流程。

详情链接:https://nvlabs.github.io/Sana/

6、告别视频录制眼神飘忽!Sieve AI黑科技,实时修正眼神问题

Sieve AI初创公司推出的创新技术旨在改变视频互动方式,通过实现视频中眼神接触的自动修复,提升视频内容的吸引力和互动性。该技术能快速集成到现有应用中,解决视频缺乏眼神接触的问题,特别适用于需要演讲者直视镜头的场景。Sieve的实时视线修正技术精妙运用AI模型和神经网络,实现眼神角度调整,保持视频流畅自然。

【AiBase提要:】

👁️ 视频互动方式改变:Sieve推出的技术实现视频中眼神接触的自动修复,提升视频吸引力和互动性。

🔧 技术优势突出:Sieve的技术快速集成现有应用,解决视频缺乏眼神接触问题,特别适用于演讲者直视镜头场景。

⚙️ 实时视线修正机制:AI模型和神经网络精准调整眼神角度,动态处理头部位置变化,保持视频自然流畅。

7、AI玩具设计师来袭:3D玩具设计工具Toy Box Flux

在数字创意的浪潮中,Toy Box Flux作为一款专注于生成3D玩具设计的人工智能模型,革新了玩具设计的方式。其独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出令人心动的可爱风格。未来,开发团队计划进一步强化模型性能,为玩具设计领域带来更多可能性。

image.png

【AiBase提要:】

🤖 Toy Box Flux是专注于生成3D玩具设计的人工智能模型,改变了玩具设计方式。

🎨 独特训练方法和精益求精的训练过程为玩具设计注入新鲜血液,展现出可爱风格。

🚀 未来计划强化模型性能,为玩具设计领域带来更多可能性。

详情链接:https://top.aibase.com/tool/toy-box-flux

8、李彦宏:未来5-10年 生成式AI将使每个人都具备程序员能力

李彦宏在与哈佛商业评论英文版总编辑的对话中,深入探讨了人工智能的发展趋势、泡沫现象以及AI与人类的未来关系。他认为技术浪潮虽难免泡沫,但少数企业将脱颖而出创造价值。AI模型准确性提升,Chatbot能提供可靠答案。AI发展或遵循历史模式,但仍有机会创造社会价值。技术革命将替代辛苦工作,创造更舒适新工作。中国注重应用驱动,百度重构产品基于大模型,预测生成式AI将提高生产力。

【AiBase提要:】

🌟 技术浪潮中的泡沫现象:少数企业将脱颖而出创造社会价值。

🚀 AI模型准确性提升:Chatbot能提供可靠答案。

💡 技术革命将替代辛苦工作:创造更舒适新工作。

9、12亿美元出售Drift后,前HubSpot高管再创业,让AI替你管理客户!

Elias Torres的故事展现了现实版的美国梦,从移民少年到科技传奇人物的成功轨迹令人瞩目。他创立的Agency利用AI技术革新客户成功管理领域,填补了CRM系统的空白,引起行业关注。

【AiBase提要:】

🚀 Elias Torres从17岁移民美国到创立Agency,展现现实版美国梦的传奇故事。

💡 Agency利用AI技术深度学习客户数据,自动化处理客户需求预测、日程安排等任务,填补CRM系统空白。

💼 Agency获得1200万美元种子轮融资,得到Sequoia合伙人和HubSpot联合创始人的支持,展望广阔的发展前景。

10、Nvidia发布了70B的新AI模型,碾压GPT-4和Claude3.5

Nvidia悄然推出了一款名为Llama-3.1-Nemotron-70B-Instruct的新型人工智能模型,表现出色,已超越了OpenAI的GPT-4和Anthropic的Claude3.5,标志着人工智能领域竞争格局的重大变化。该模型在知名AI平台Hugging Face上发布,引起业界关注。Nvidia展示了强大的AI软件开发能力,支持企业探索AI解决方案。然而,用户需谨慎使用,避免错误或滥用。

image.png

【AiBase提要:】

🌟 新发布的Llama-3.1-Nemotron-70B-Instruct模型表现超越OpenAI和Anthropic,标志着AI竞争的重大变化。

🚀 Nvidia将其AI发展从硬件扩展到软件,展示出强大的模型开发能力。

💻 该模型提供了易于使用的API接口,使更多企业能获取并使用先进的AI技术。

详情链接:https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

11、AI协作工具Cove完成600万美元融资,前谷歌团队打造类notion可视化工作空间

Cove是一家由前Google Maps核心团队成员创立的AI初创公司,致力于开发新一代智能工作空间,解决AI对话工具在复杂项目协作中的限制。他们推出的可视化工作空间结合AI协作,提供更自然的工作方式,已获得600万美元种子轮融资。

image.png

【AiBase提要:】

🚀 Cove完成600万美元种子轮融资,投资方包括Sequoia Capital、Elad Gil、Homebrew。

🔑 Cove提供类似Notion的可视化工作空间,用户可自由组织多种内容形式,AI作为协作者直接参与内容创建和优化。

💡 Cove配备强大的Chrome扩展,与常用办公工具无缝对接,智能提供帮助,应用场景广泛。

详情链接:https://top.aibase.com/tool/cove

12、台积电财报:Q3净利润增长54%达101亿美元

这篇文章报道了台积电在全球芯片需求持续上涨背景下,2024年第三季度财报的亮眼表现。公司净利润达到3523亿新台币,同比增长54%,超出市场预期。台积电作为高级芯片制造商,受益于人工智能应用的快速发展,业绩得到显著提升。

【AiBase提要:】

🌟 台积电Q3净利润达101亿美元,同比增长54%。

💻 人工智能推动高性能芯片需求,助力业绩增长。

🚀 台积电持续扩大生产能力,以满足市场日益增长的需求。

举报

  • 相关推荐
  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

    本期AI日报聚焦多项AI领域重要进展:1) Midjourney推出首款视频生成模型V1,支持21秒视频生成;2) OpenAI CEO确认GPT-5将于今夏发布;3) Google上线语音对话搜索功能Search Live;4) OpenAI开源客户服务代理框架;5) MiniMax发布智能代理Agent;6) 恶意工具WormGPT出现新变种;7) OpenAI推出企业版ChatGPT折扣;8) DeepSite V2支持3D网页动画生成;9) AI工具可秒变PPT;10) 比亚迪与字节跳动合作开发动力电池技术;11) 马斯克否认xAI巨额亏损传闻。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

    【AI日报】今日AI领域重要动态:1)月之暗面发布Kimi-Researcher智能体,多轮搜索推理能力超越谷歌和OpenAI同类产品;2)MiniMax推出Voice Design功能,支持多语言/音色组合;3)火山引擎上线AI智能域名推荐功能;4)Anthropic强化VSCode集成;5)Google推出Gemini2.5Flash-Lite模型,可实时生成交互界面;6)苹果拟300亿美元收购AI公司Perplexity;7)月之暗面开源Kimi-2506多模态模型;8)Firecrawl将推出开源问答引擎Fireplexity;9)银河通用机器人获宁德时代10亿元融资;10)字节跳动发布DreamActor-H1视频生成系统;11)Google推出开源实时音乐生成模型Magenta RealTime;12)开源AI设计工具Jaaz发布。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。