• 如何评估大语言模型

    时间:2023-03-29 11:07:39

    大家可以使用 Hugging Face Space 上的 Evaluation on the Hub 应用在零样本分类任务上评估大语言模型啦! 零样本评估是研究人员衡量大语言模型性能的一种流行方法。因为大语言模型已经在训练过程中 显示 出了对无标注数据的学习能力。反向缩放奖 是近期社区的一项工作,通...

  • 大语言模型: 新的摩尔定律?

    时间:2023-02-21 14:08:42

    译者按: 最近一段时间,ChatGPT 作为一个现象级应用迅速蹿红,也带动了对其背后的大语言模型 (LLM) 的讨论,这些讨论甚至出了 AI 技术圈,颇有些到了街谈巷议的程度。在 AI 技术圈,关于 LLM 和小模型的讨论在此之前已经持续了不短的时间,处于不同生态位置和产业环节的人都有表达自己的观点...

  • 大语言模型的最新研究方向综述

    时间:2023-01-31 01:30:55

    在自然语言处理( Natural Language Processing, NLP)领域,其最新代表之作ChatGPT凭借卓越的多轮对话和内容生成能力,正掀起新一轮人工智能研究、商用及创业热潮。最近在研究这一话题的过程中,关注到了大语言模型的最新研究,大致有如下几个板块: 参数规模和数据规模的探索 ...

  • 【自然语言处理】【ChatGPT系列】Chain of Thought:从大模型中引导出推理能力

    时间:2022-12-24 15:53:39

    Chain-of-Thought Prompting:从大模型中引导出推理能力 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》 论文地址:https://arxiv.org/pdf/2201.1190...

  • 【自然语言处理】【ChatGPT系列】大模型的涌现能力

    时间:2022-12-12 17:56:15

    大语言模型的涌现能力 《Emergent Abilities of Large Language Models》 论文地址:https://arxiv.org/pdf/2206.07682.pdf 相关博客【自然语言处理】【ChatGPT系列】大模型的涌现能力【自然语言处理】【文本生成】CR...

  • “地理-语言”大模型文心ERNIE-GeoL及应用

    时间:2022-10-26 11:16:50

    本系列根据WAVE SUMMIT 2022深度学习开发者峰会「AI大模型 智领未来」论坛嘉宾分享整理。本文整理自百度人工智能技术委员会主席、百度地图首席研发架构师黄际洲的主题演讲——“地理-语言”预训练大模型文心ERNIE-GeoL及应用。实践中的观察 POI检索需要语义与空间双轮驱动 大家...

  • 快速上手Meta大语言模型LLaMA,构建“本地化ChatGPT”

    时间:2022-09-04 00:58:58

    近期,Meta发布了人工智能大语言模型LLaMA,包含70亿、130亿、330亿和650亿这4种参数规模的模型。其中,最小的LLaMA 7B也经过了超1万亿个tokens的训练。本文我们将以7B模型为例,分享LLaMA的使用方法及其效果。1. LLaMA的上手指南这一部分,我们将step by st...

  • Cursor编程初体验,搭载GPT-4大模型,你的AI助手,自然语言编程来了

    时间:2021-08-01 01:17:40

    背景 这两天体验了下最新生产力工具Cursor,基于最新的 GPT-4 大模型,目前免费,国内可访问,不限次数,跨平台,你确定不来体验一把?官方的 Slogan : Build Software. Fast. Write, edit, and chat about your code with ...

  • 达观数据陈运文:探索大语言模型,“对症下药”很关键

    时间:2020-12-01 01:02:48

    内容来源:ChatGPT 及大模型专题研讨会 分享嘉宾:达观数据董事长兼CEO 陈运文博士分享主题:《探索大语言模型垂直化训练技术和应用》 转载自CSDN稿件本文整理自 3月11日 《ChatGPT 及大规模专题研讨会》上,达观数据董事长兼CEO 陈运文博士关于《探索大语言模型垂直化训练技术和应用》...