在当今AI大模型(LLM)席卷全球的背景下,出现了一个全新的职业——提示词工程师(Prompt Engineer)。无数人们在Github上寻找“咒语”,在Discord里分享“秘籍”,试图通过复杂的结构化Prompt来驯服AI。这一现象被一些人视为一种工程技术,甚至是一种需要运气的“玄学”。然而,如果我们跳出代码和参数的视角,回归到大模型的本质——语言,我们会发现,早在一个世纪前,哲学家路德维希 ...
北航、人大和九坤投资共同撰写的论文 《Scaling Laws for Code: Every Programming Language Matters》 整理而成。 在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。
腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
近日,一封由 AI 系统生成的感谢邮件在技术圈引发广泛关注和讨论。Python 之父 Guido van Rossum 对收到的邮件回应一句「Stop」,React 核心团队成员、Redux 作者 Dan Abramov 则投诉称“垃圾邮件泛滥”。
scons ( 2.3.0 ) ant ( 1.8.2 ) Python ( 2.7.3 ) PostgreSQL ( 9.3.4 ) Linux x86-64: g++ ( 4.3.4 ) gcc ( 4.3.4 ) make ( 3.81 ) kernel ( 3.0.13-0.27-default ) Linux PPC64: g++ ( 4.3.4 ) gcc ( 4.3.4 ) make ...
前端UI的工作,被谷歌AI一夜干没了。 就在最新能力展示中,Gemini 3.0 Pro居然自己“捏”出了一个macOS。 打开凤凰新闻客户端 提升3倍流畅度 只靠几行提示词,谷歌的AI就在浏览器里复刻出了苹果引以为傲的UI。 Prompt : Design and create a web os like mac os full functional features from text edi ...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!数据质量决定了模型智能的上限,而DataFlow将数据准备从手工作坊升级为了自动化工 ...
这两天,科技圈和金融圈的朋友圈被 MiniMax 赴港上市的消息刷屏。作为大模型领域的明星独角兽,MiniMax 的“上岸”无疑给行业投下了一颗深水炸弹。 但比起资本市场的喧嚣,作为开发者,我更关心其产品底层实力的进化。
单个字符对大模型来说意义有限,使用GPT系列的Llama系列的tokenizer就会发现, 20个字符的问题,在不同AI眼中是10-13个token。
这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
小黑盒游戏 on MSN
国内首个AI项目资源站发布! 代号Inferri! 收录3800个顶级项目!
【本文由小黑盒作者@idea小时于12月30日发布,转载请标明出处!】 Introducing Inferri: Navigate the AGI Era. Inferri官网 互联网上每天诞生成百上千个 AI ...
就在昨天,新加坡国立大学、中国人民大学、复旦大学等多所顶尖机构联合发布了一篇AI Agent 记忆(Memory)综述。 当前的 LLM 应用开发正面临严重的“记忆碎片化”问题:我们有用于短期记忆的 KV Cache,有用于知识检索的 RAG,还有用于长期交互的 MemGPT 类架构,但缺乏统一的理论指导。这篇综述不仅是对现有工作的盘点,更是一份解决“灾难性遗忘”与“上下文溢出”的系统方案。它详细 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果