11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
AnimagineXL3.1,一款全新的开源动漫主题文本到图像模型,已经正式发布。该版本在原有的基础上进行了一系列的升级和优化,使其对广泛的动漫作品和风格的理解更加深入,覆盖了从古老到现代的各种艺术风格。这些图像覆盖了广泛的动漫角色、风格和主题,为模型提供了一个深厚的知识基础。
OpenSora是一个开源项目,专注于高效生成高质量视频,同时开放模型、工具和内容供所有人使用。通过拥抱开源原则,OpenSora不仅民主化了获取先进视频生成技术的途径提供了一个简化视频制作复杂性的流畅、用户友好的平台。点击前往OpenSora官网体验入口需求人群:视频创作、影视制作、教育资源生成、营销视频制作等使用场景示例:制作一个介绍新产品的短视频营销片为在线教育课程生成视频示范教程资源创作一个短小精彩的虚构视频作品产品特色:视频生成视频预处理工具视频训练加速支持官方权重推理支持多种视频分辨率如果想了解更多关于OpenSora的信息,请访问官方网站。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放【AiBase提要:】🚀马斯克旗下xAI公司开源了3140亿参数的混合专家模型「Grok-1」及权重和网络架构。⭐OpenRouter�
马斯克的AI创企xAI正式宣布其大语言模型Grok-1已实现开源,并向公众开放下载。Grok-1是一款基于混合专家系统技术构建的大语言模型,拥有3140亿参数,远超OpenAIGPT-3.5的1750亿。xAI并没有放出Grok-1的具体测试成绩,它与其他公司的大模型之战将成为业内关注的焦点。
伊隆·马斯克在AI未来控制战中迈出了一步,他于周日公开了他版本的人工智能聊天机器人的原始计算机代码。Grok聊天机器人由马斯克去年创立的xAI公司开发,其设计旨在提供模仿科幻小说《银河系漫游指南》风格的刻薄回复。但他补充说,像xAI和Meta这样的公司并不一定是出于这个原因开源技术。
Grok-1是一个全球热门的大型语言模型,专家混合模型,包括了314亿参数的训练。该模型未经针对特定应用的微调,是Grok-1预训练阶段的原始基础模型检查点。了解更多关于Grok-1的信息,访问官网。
马斯克旗下xAI宣布开源Grok-1。Grok-1基础模型基于大量文本数据训练,共有3140亿参数。该公司团队成员曾在DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉及多伦多大学供职,由埃隆・马斯克领导。
马斯克承诺的开源版大模型Grok终于来了!今天凌晨,马斯克旗下大模型公司xAI宣布正式开源3140亿参数的混合专家模型「Grok-1」,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。鉴于马斯克对开源的积极态度,有些技术人员已经在期待后续版本的开源了。
不久前OpenAISora以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继2周前推出成本直降46%的Sora训练推理复现流程后,Colossal-AI团队全面开源全球首个类Sora架构视频生成模型「Open-Sora1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球AI热爱者共同推进视频创作的新纪元。欢迎持续关注Open-Sora开源项目:https://github.com/hpcaitech/Open-Sora作者团队表示,他们将会继续维护和优化Open-Sora项目,预计将使用更多的视频训练数据,以生成更高质量、更长时长的视频内容,并支持多分辨率特性,切实推进AI技术在电影、游戏、广告等领域的落地。
单击画面中的火箭,输入“发射”prompt,瞬间起飞!就连想要回收火箭,也只需要输入“Launchdown”,再轻轻一点击:马斯克看了都要自我怀疑一下,这火箭发射这么简单,自家星舰成功进入太空怎么那么难??以上效果来自一个新的图生视频模型Follow-Your-Click,由腾讯混元、清华大学和香港科技大学联合推出。食用方法非常友好:任意一张照片输入模型,只需要点击对应区域,加上少量简单的提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。该团队已经作为技术合作伙伴,支持了《人民日报》的原创视频《江山如此多娇》。
香港大学发布了OpenGraph,这是一项突破性的成果,成功攻克了图基础模型领域的三大难题。该模型通过巧妙的技术实现了零样本学习,可以适配多种下游任务。OpenGraph的问世填补了图基础模型领域的空白,为通用图模型的发展提供了新的思路和技术支持,具有广泛的应用前景。
由颜水成和程明明领衔的研究团队在Sora核心技术上进行了重要的升级,推出了MaskedDiffusionTransformerV2。该模型在ImageNetbenchmark上取得了惊人的成绩,FIDscore达到1.58,刷新了State-of-the-Art。这一工作符合Sora的期望,通过生成模型构建物理世界模拟器的理念,为未来的表征学习和生成学习研究提供了有力的启示。
3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,分为1.3b和7b两种规模,共有4个版本。它具有融合语言和视觉能力,可以在不损失语言理解能力的情况下处理多模态任务,识别高分辨率图像中的细小物体。成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。
医疗人工智能技术正在迅速发展,旨在利用大型语言模型的巨大潜力彻底改变医疗保健交付方式。这些技术进步承诺提高诊断准确性,个性化治疗方案,并解锁全面医学知识的获取,从根本上改变患者护理。该倡议弥补了全球医疗沟通中的重要差距,并为未来的多语言医疗AI创新奠定了基础。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
LaVague是一个旨在自动化浏览器交互的大型动作模型框架,通过将自然语言指令转化为无缝的浏览器交互,重新定义了互联网浏览体验。该框架的设计初衷是为用户自动化繁琐的任务,节省时间,让用户能够专注于更有意义的事务。未来的发展方向可能包括优化本地模型、改进信息检索以确保生成的代码片段相关性、支持其他浏览器引擎等。
【新智元导读】刚刚,OpenAI超级对齐团队负责人官宣开源Transformer调试器。研究人员不用写代码,就能快速探索LLM的内部构造了!AGI真的越来越近了!为了确保人类不被AI杀死,在解密神经网络/Transfomer黑箱这一方面,OpenAI从未停下脚步。研究人员使用了了几个附加指标的组合:不过研究人员也表示,希望从Transformer上训练的稀疏自动编码器中,为字典学习解决方案确定更好的指标。
——扩大模型选择范围,帮助企业以可信和灵活的方式扩展AI-IBM提供Mixtral-8x7B的优化版本,该版本可将延迟时间最多缩短75%-IBM、第三方和开源模型的目录不断增加,为客户提供更多选择和灵活性-是watsonx人工智能与数据平台上最新的开源模型,watsonx提供企业就绪的人工智能开发平台、数据存储和治理功能IBM近日宣布,由MistralAI公司开发的广受欢迎的开源Mixtral-8x7B大型语言模型已经可在其watsonx人工智能与数据平台上使用。IBM提供了Mixtral-8x7B的优化版本,在内部测试中,与常规模型相比,该版本能够将吞吐量提高50%[i]。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是IBM业务发展的基石。
VisionPro又现火爆新玩法,这回还和具身智能联动了~就像这样,MIT小哥利用VisionPro的手部追踪功能,成功实现了对机器狗的实时控制。不仅开门这样的动作能精准get:也几乎没什么延时。作者本人也在论文中写道:最后,提醒一下,如果你想上手试一试这个开源项目,那么除了必备一台VisionPro之外需要准备:苹果开发者账户VisionPro开发者配件安装了Xcode的Mac电脑嗯,看样子还是得先让苹果赚一笔了。
马斯克宣布将在本周开源由xAI旗下公司推出的生成式AI产品——Grok。这款类ChatGPT产品于去年11月首次亮相,针对生成文本、代码、邮件和信息检索等多个领域提供功能。以上内容参考xAI官网,如有侵权请联系删除。
最近AIGC的落地,又有了一些热议和争论。在金沙江创投主管合伙人朱啸虎的爆款采访中,他表达了对自研大模型商业闭环的悲观,但又坚定地表示非常看好应用,“我信仰AGI,但我信仰应用啊,信仰能马上商业化的。尽管有了Sora那样惊艳世人的模型出场,FancyTech的目标倒是一直没变过:“我们希望成为长视频赛道里,对现实还原得最好的公司。
马斯克表示,xAI将于本周开源AI聊天机器人Grok。xAI是埃隆・马斯克成立的人工智能公司,于2023年7月12日宣布成立。该团队在Space活动上做了自我介绍,展示了他们在数学、物理和计算机科学领域的专业知识和经验。
aiwechat-vercel是一个使用vercel的functions,将ai功能加入微信公众号的开源项目。它提供支持接入gpt、星火、通义千问、gemini等AI功能,具有超时回复、连续问答、图床功能等特点。要了解更多关于aiwechat-vercel的信息并开始使用该工具,请访问aiwechat-vercel官方网站。
MIT博士生利用VisionPro开源项目成功实现了对机器狗的实时训练。TrackingSteamer这一应用程序通过追踪人类动作,并将数据传输到其他机器人设备,为未来与机器人互动提供了新方式。虽然项目需要使用VisionPro设备和开发者配件,但这不影响人们对其开源项目的兴趣和关注,展现了对未来科技发展的热切期待。
小狐狸GPTAI创作系统是一个完全开源的系统,支持自主二次开发。系统框架采用ThinkPHP6Vue-admin开发,提供了微信小程序、移动端H5、PC端网站和公众号等应用端。系统将为您提供AI创作、文生视频和绘图功能,满足您的创作需求。
MyShell公司宣布其多语言、多口音的文本转语音库MeloTTS正式开源。这一消息在开源社区引起了广泛关注。MeloTTS的开源无疑为文本转语音领域带来了新的可能性,我们期待看到更多的创新和应用。
Yi-9B是01.AI研发的下一代开源双语大型语言模型系列之一。训练数据量达3T,展现出强大的语言理解、常识推理、阅读理解等能力。要获取更多详细信息并开始体验Yi-9B,请访问Yi-9B网站。
零一万物团队发布并开源了Yi-9B模型,这是零一万物Yi系列模型中的“理科状元”,在代码和数学能力方面表现最佳,并且具有强大的中文能力。该模型的优势包括:1.代码和数学能力出色,综合实力强劲。Yi-9B模型在代码、数学和中文能力方面表现出色,是一款全面综合能力强大的模型,可在消费级显卡上部署,并且具有较低的使用成本。
情感识别技术在各种场景中都有广泛的应用,如客服机器人根据客户语气调整策略、智能助手根据用户情绪提供建议、情感健康应用监测用户情感状态。为了支持情感理解,上海交通大学、阿里巴巴、复旦大学和香港中文大学的研究者联合开发了通用的语音情感表征模型emotion2vec。这表明emotion2vec不仅在训练数据集上表现优秀能适应不同录音环境,为多样情感任务提供支持。
【新智元导读】StabilityAI放出了号称能暴打闭源模型的StableDiffusion3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新的高度。StabilityAI在发布了StableDiffusion3之后,今天公布了详细的技术报告。网友热议网友们对StabilityAI不断撩拨用户但是不让用的行为显得有些不耐烦了,纷纷催促赶快上线让大家使用。