首页 > 业界 > 关键词  > 模型最新资讯  > 正文

AI视野:Code Llama微调模型WizardCoder完胜GPT-4;AI免费工具集Bored Humans来了

2023-08-28 15:32 · 稿源:站长之家

英伟达推出全新的AI模型NVIDIA DLSS3.5大幅提升光影效果

英伟达推出全新的AI模型NVIDIA DLSS3.5,采用光线重建技术,可以为密集型光追游戏和应用程序生成更高质量的光追图像,代表了实时光线追踪技术向前迈进了一大步。

image.png

要点:

  • 采用光线重建技术,通过AI学习生成更高质量光线追踪图像,大幅提升光影效果。

  • 与DLSS3相比,增加5倍训练数据,可以更智能地处理时间和空间数据,生成更清晰图像。

  • 与超分辨率和帧生成技术结合,可大幅提升光追游戏性能和画质表现。

秒杀闭源模型!Code Llama神秘版本WizardCoder曝光

Code Llama 是 Meta 开源的强大代码生成 AI 模型,能够辅助编写计算机代码,具备出色的代码能力,微调版本WizardCoder在 HumanEval 基准测试中超过了 GPT-4。Code Llama 的三个版本分别为7B、13B 和34B,其中34B 版本经过微调达到了73.2% 的胜率。这一开源模型的出现激励了开源社区,展示了其在 AI 编码领域的巨大潜力。

image.png

要点:

  • Code Llama 是 Meta 开源的文本生成代码模型,能够帮助开发人员自动生成编程代码。

  • Code Llama包含7亿、13亿、34亿参数的基础模型版本。34亿参数版本在HumanEval和MBPP评测中性能优于其他模型。

  • 基于Code Llama微调的模型WizardCoder以73.2%的胜率碾压GPT-4的3月份版本(67%)

Runway又一竞争对手来了!Morph Studio可一键生成短视频

最近,一些创业公司开始把视线从AI图片生成转移到AI视频生成上,Morph Studio通过纯文本就可以生成高质量的短视频,提供了一个无门槛的视频内容创作方式,有望为短视频创作带来变革。

image.png

体验地址:https://discord.com/invite/2ffQj2UmSP

要点:

  • Morph Studio可以通过纯文本提示生成高质量短视频,效果明显优于类似工具。

  • Morph Studio的目标是成为一个面向消费级的视频社区产品。

  • AI视频生成可以为内容创作、应用和商业模式带来许多新的想象。

AI免费工具集Bored Humans来了!提供Mid等100多款主流工具平替

Bored Humans是一个拥有100多种免费AI工具的网站,包含图像生成、播客生成等功能,可替代许多付费工具,但生成图像质量通常不如Midjourney等复杂模型,其背后的公司由美国域名投资者Eric Borgos创立。

image.png

网站网址:https://boredhumans.com/

要点:

  • 网站包含100多种免费AI小工具,可替代诸如Canva等付费工具

  • 该网站的AI工具具有趣味性和创新性,但生成图像质量不高

  • 网站由美国域名投资者Eric Borgos创立,已经开发互联网工具25年

又一个妙鸭挑战者出现!写真0元购,新用户可白嫖25张

最近,一款名为木目AI的AI绘图工具引发关注,它被称为9块9「写真」妙鸭的竞争者,注册可免费白嫖生成25张写真图。

QQ截图20230828155849.jpg

要点:

  • AI写真APP妙鸭出现竞争者,可免费试用生成25张写真图。

  • 新工具名为木目AI,通过上传照片训练模型,支持文本和图片两种生成方式。

  • 木目AI背后公司为Artisse Interactive,公司业务分为Artisse Gaming和Artisse AI两大板块。

AI看得懂路牌和食品包装了!视觉语言模型BLIVA让AI更擅长阅读

BLIVA是一种新型视觉语言模型,它结合了InstructBLIP的学习查询嵌入和LLaVA的编码修补嵌入,在多个数据集上表现优异,尤其擅长阅读图像中的文本信息,可用于识别路牌、食品包装等多种场景。

image.png

项目网址:https://huggingface.co/datasets/mlpc-lab/YTTB-VQA

要点:

  • BLIVA融合了InstructBLIP和LLaVA两种互补的视觉嵌入。

  • BLIVA在多个数据集上的表现明显优于其他模型如InstructBLIP。

  • BLIVA可用于识读图像文本,应用于识别路牌、食品包装等多种场景。

昆仑万维自研AI游戏平台Club Koala亮相 预计年末正式发行

8月25日,昆仑万维旗下游戏工作室 Play for Fun 自研的国内首款 AI 游戏 Club Koala 在德国科隆展亮相。该游戏通过 AI 赋能 UGC 游戏开发,提供全新的游戏体验和创造力,引领游戏行业变革。

要点:

  • Club Koala是昆仑万维旗下游戏工作室自研的国内首款AI游戏

  • Club Koala通过AI赋能实现UGC游戏开发,提供全新的游戏体验

  • Club Koala核心是无代码游戏编辑器和AI NPC,预计年末发行

微信截图_20230828081812.png

比亚迪冲进人形机器人赛道!200万投资稚晖君的智元机器人

比亚迪投资智元机器人近200万元,首次进军人形机器人领域,与其合作研发工业机器人应用。

image.png

要点:

  • 比亚迪首次投资智元机器人近200万元,正式进军人形机器人领域。

  • 智元机器人首款产品远征A1已公开展示,计划进入工厂进行自动装配。

  • 人形机器人领域正在快速发展,多家科技公司积极布局参与竞争。

想不起电影名字?Film Recommender一句话就能找到电影

Film Recommender是一款依据用户个性化喜好,通过简单文字描述实现电影智能推荐和发现的工具,它可以大大提高用户的电影观影体验和满意度。

image.png

体验地址:https://filmfinder.ai/#hayo

要点:

  • 根据用户个性化信息进行智能电影推荐。

  • 简单文字描述就可以找到感兴趣电影,提升效率。

  • 辅助用户发现更多高质量、感兴趣电影,提升观影乐趣。

举报

  • 相关推荐
  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • 免费 GEO品牌可见度查询——让大模型信得过就这么玩

    本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括:可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力;提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度,通过持续优化提升在大模型入口的推荐概率。

  • 来教装展,看全栈自主可控国产教育大模型何以赋能教学?

    10月24-26日,第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心,展示五大智慧教育场景:智慧教学通过AI黑板实现师生协同,提升效率;科学教育推出AI虚拟科学家互动平台,激发探索精神;身心健康方案构建体育健康闭环与心理服务体系;教育治理推出数据驱动决策平台;学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校,服务超1.3亿师生,展现AI从工具升级为“教育伴侣”的价值。

  • 升级版“蓝心小V”亮相,豆包大模型助力vivo打造AI原生体验

    vivo发布全新OriginOS 6系统,升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同,实现精准意图识别与多模态交互,支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合,提供低延迟、高情感语音响应。同时拓展无障碍服务,为视障用户提供实时视觉辅助。未来将持续深化AI生态建设,打造更智能便捷的原生体验。

  • “大模型应用”新风口:“无人测试”趋势,CIO/CTO如何应对

    当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈,而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试,可提升测试效率300%、降低成本30%,并将产品发布周期从"月"压缩至"周"。这不仅是技术升级,更是重构IT成本结构、实现降本增效的战略支点,助力IT部门从成本中心转型为价值创造中心。

  • 触觉增强世界模型引关注,一目科技IROS首秀定义机器人感知新维度

    在2025年IROS大会上,中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器,厚度大幅缩减,实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式,指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术,突破传统数据收集限制,显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务,验证了触觉感知在精细操控中的核心价值,为"操控即服务"产业愿景提供技术支撑。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • 快手进军AI Coding,开发工具、模型和Maas平台齐登场

    10月23日,快手StreamLake发布全新AI编程产品矩阵,以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持,KAT-Coder在权威测试中性能超越GPT-5,平台保障99.95%服务可用性。该生态旨在通过技术普惠,为企业与开发者提供颠覆性研发体验,推动AI编程普及。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

今日大家都在搜的词: