大语言模型相关文章

如何评估大语言模型
时间：2023-03-29 11:07:39
大家可以使用 Hugging Face Space 上的 Evaluation on the Hub 应用在零样本分类任务上评估大语言模型啦！零样本评估是研究人员衡量大语言模型性能的一种流行方法。因为大语言模型已经在训练过程中显示出了对无标注数据的学习能力。反向缩放奖是近期社区的一项工作，通...
大语言模型: 新的摩尔定律？
时间：2023-02-21 14:08:42
译者按: 最近一段时间，ChatGPT 作为一个现象级应用迅速蹿红，也带动了对其背后的大语言模型 (LLM) 的讨论，这些讨论甚至出了 AI 技术圈，颇有些到了街谈巷议的程度。在 AI 技术圈，关于 LLM 和小模型的讨论在此之前已经持续了不短的时间，处于不同生态位置和产业环节的人都有表达自己的观点...
大语言模型的最新研究方向综述
时间：2023-01-31 01:30:55
在自然语言处理( Natural Language Processing, NLP)领域，其最新代表之作ChatGPT凭借卓越的多轮对话和内容生成能力，正掀起新一轮人工智能研究、商用及创业热潮。最近在研究这一话题的过程中，关注到了大语言模型的最新研究，大致有如下几个板块：参数规模和数据规模的探索 ...
【自然语言处理】【ChatGPT系列】Chain of Thought：从大模型中引导出推理能力
时间：2022-12-24 15:53:39
Chain-of-Thought Prompting：从大模型中引导出推理能力《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》论文地址：https://arxiv.org/pdf/2201.1190...
标签：自然语言处理自然语言处理 chatgpt 人工智能推理能力 ChainofThought
【自然语言处理】【ChatGPT系列】大模型的涌现能力
时间：2022-12-12 17:56:15
大语言模型的涌现能力《Emergent Abilities of Large Language Models》论文地址：https://arxiv.org/pdf/2206.07682.pdf 相关博客【自然语言处理】【ChatGPT系列】大模型的涌现能力【自然语言处理】【文本生成】CR...
标签：自然语言处理自然语言处理 chatgpt 大模型语言模型涌现
“地理-语言”大模型文心ERNIE-GeoL及应用
时间：2022-10-26 11:16:50
本系列根据WAVE SUMMIT 2022深度学习开发者峰会「AI大模型智领未来」论坛嘉宾分享整理。本文整理自百度人工智能技术委员会主席、百度地图首席研发架构师黄际洲的主题演讲——“地理-语言”预训练大模型文心ERNIE-GeoL及应用。实践中的观察 POI检索需要语义与空间双轮驱动大家...
快速上手Meta大语言模型LLaMA，构建“本地化ChatGPT”
时间：2022-09-04 00:58:58
近期，Meta发布了人工智能大语言模型LLaMA，包含70亿、130亿、330亿和650亿这4种参数规模的模型。其中，最小的LLaMA 7B也经过了超1万亿个tokens的训练。本文我们将以7B模型为例，分享LLaMA的使用方法及其效果。1. LLaMA的上手指南这一部分，我们将step by st...
Cursor编程初体验，搭载GPT-4大模型，你的AI助手，自然语言编程来了
时间：2021-08-01 01:17:40
背景这两天体验了下最新生产力工具Cursor，基于最新的 GPT-4 大模型，目前免费，国内可访问，不限次数，跨平台，你确定不来体验一把？官方的 Slogan ： Build Software. Fast. Write, edit, and chat about your code with ...
达观数据陈运文：探索大语言模型，“对症下药”很关键
时间：2020-12-01 01:02:48
内容来源：ChatGPT 及大模型专题研讨会分享嘉宾：达观数据董事长兼CEO 陈运文博士分享主题：《探索大语言模型垂直化训练技术和应用》转载自CSDN稿件本文整理自 3月11日《ChatGPT 及大规模专题研讨会》上，达观数据董事长兼CEO 陈运文博士关于《探索大语言模型垂直化训练技术和应用》...