大模型 - 程序员宅基地

什么是大模型？一文读懂大模型的基本概念

标签：人工智能

大模型通过训练海量数据来学习复杂的模式和特征，具有更强大的泛化能力，可以对未见过的数据做出准确的预测。引申到模型层面，涌现能力指的是当模型的训练数据突破一定规模，模型突然涌现出之前小模型所没有的、意料...

如何学习训练大模型——100条建议（附详细说明）

标签：学习人工智能深度学习

通过深入了解这些细节，并在实际项目中应用相关的知识，将能够更好地理解和利用大模型的潜力，不仅在学术研究中，也在工程实践中。通过不断探索新方法、参与项目和保持热情，并将其应用于各种领域，从自然语言处理到...

“开源 vs. 闭源：大模型的未来发展趋势预测“——探讨大模型未来的发展方向

标签：开源大模型闭源

在当今快速发展的技术和商业环境下，大模型在各个领域都有着广泛的应用。然而，开源和闭源两种不同的开发模式一直是业界争论的热点。本篇文章将探讨这两种模式对大模型未来发展的影响，以及其中的利弊和走向。“开源...

2022中国大模型发展白皮书.pdf

标签：大模型

2022中国大模型发展白皮书.pdf

[LLM]大模型训练DeepSpeed(一)-原理介绍

标签：深度学习人工智能

DeepSpeed是由Microsoft提供的分布式训练工具，旨在支持更大规模的模型和提供更多的优化策略和工具。与其他框架相比，DeepSpeed支持更大规模的模型和提供更多的优化策略和工具。其中，主要优势在于支持更大规模的...

大模型上下文扩展之YaRN解析：从直接外推ALiBi、位置插值PI、NTK-aware插值、YaRN

标签：大模型上下文扩展 RoPE ALiBi

下半年以来，我全力推动我司大模型项目团队的组建，我虽兼管整个项目团队，但为了并行多个项目，最终分成了三个项目组，每个项目都有一个项目负责人，分别为霍哥、阿荀、朝阳，有何问题欢迎随时留言评论，thanks...

AI大模型知识点大梳理

标签：人工智能大模型 chatgpt

AI大模型是指具有巨大参数量的深度学习模型，通常包含数十亿甚至数万亿个参数。这些模型可以通过学习大量的数据来提高预测能力，从而在自然语言处理、计算机视觉、自主驾驶等领域取得重要突破。AI大模型的定义具体...

大模型训练大模型训练大模型训练

标签：大模型

大模型训练大模型训练

大模型学习篇(一)：初识大模型

标签：语言模型自然语言处理计算机视觉

初识大模型，了解什么是语言模型，以及大模型和小模型的区别。

【大模型】大型模型飞跃升级—文档图像识别领域迎来技术巨变

标签：垂直大模型图像识别模型 chatgpt

通过对GPT-4V和文档识别领域的深入分析和思考，为OCR文档识别领域的研究开辟了新的方向。...素级OCR统一模型、OCR大一统模型、文档识别分析+LLM（LanguageModel）等应用的新方向。下面来详细看一下。

AI：大模型领域最新算法SOTA核心技术要点总结(一直持续更新)、大模型实战与理论经验总结(训练优化+代码实战...

标签：人工智能 LLMs 大语言模型

AI：大模型领域最新算法SOTA核心技术要点总结(一直持续更新)、大模型实战与理论经验总结(训练优化+代码实战+前沿技术探讨+最新案例应用)、带你精细解读多篇优秀的大模型论文、AI领域各种工具产品集合(文本/图片/编程...

AI大模型探索之路-训练篇3：大语言模型全景解读

标签： AIGC 人工智能语言模型

大规模语言模型（Large Language Models，LLM），也称大语言模型或大型语言模型，是一种由包含数百亿以上参数的深度神经网络构建的语言模型，通常使用自监督学习方法通过大量无标注文本进行训练。

AI大模型学习

标签：人工智能学习

在当前技术环境下，AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力，还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法，AI大模型学习能够不断提升模型的准确性和效率，为人类生活和...

部署大模型API的实战教程

标签：大模型 API 人工智能

今天给大家带来的文章是部署大模型API的实战教程，希望能对学习大模型的同学们有所帮助。文章目录 1. 前言 2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 3. 运行代码 3.1 修改文件 3.2 运行API 3.3 测试API

【LLM】大模型值得探索的十个研究方向

标签：深度学习大模型自然语言处理

基础理论：大模型的基础理论是什么？网络架构：Transformer是终极框架吗？高效计算：如何使大模型更加高效？高效适配：大模型如何适配到下游任务？可控生成：如何实现大模型的可控生成？安全可信：如何改善大模型中...

百度智能云“千帆大模型平台”升级，大模型最多，Prompt模板最全

标签：人工智能百度智能云大模型

百度智能云“千帆大模型平台”升级，大模型最多，Prompt模板最全。

百度智能云：千帆大模型平台接入Llama 2等33个大模型，上线103个Prompt模板

标签： AIGC 大语言模型百度智能云

今天给大家带来的是百度智能云：千帆大模型平台接入Llama 2等33个大模型，上线103个Prompt模板，希望能对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 大而全+持续进化的大语言模型平台 3. Prompt海量...

【LLM】大模型幻觉问题的原因和缓解方法

标签：大模型自然语言处理幻觉问题

一、幻觉定义备注（下面提及的两个名词）： Faithfulness：是否遵循input content； Factualness：是否符合世界知识；传统nlp任务重，幻觉大多数是faithfulness，比如Intrinsic Hallucination（冲突），摘要内容...

程序员敲代码的“姿势”，正在被大模型改写！

作者 | 《新程序员》编辑部出品 | CSDN（ID：CSDNnews）大型模型的兴起和发展正在彻底改变着软件行业的面貌，为开发者们带来了更强大的工具和技术支持，使他们能够构建更智能、更复杂的软件系统。借助大型模型的能力...

什么是大模型

标签：大模型

大模型（Big Model）是指在机器学习和人工智能领域中处理大规模数据和复杂模型的一种方法或技术。随着数据量的不断增加和模型的复杂度提高，传统的机器学习方法已经无法有效处理，因此大模型成为了解决这一挑战的...

技术干货｜什么是大模型？超大模型？Foundation Model？

标签：机器学习人工智能深度学习

目前Foundation Model或者是大模型，特别地火，接下来介绍什么是大模型，大模型的基本概念；接着看看大模型的实际作用，然后基于这些实际作用，我们简单展开几个应用场景。最后就是介绍支持大模型训练的AI框架。在往...

大模型系列｜垂直大模型的几种训练策略（一）

标签： prompt 大模型 LLM

垂直行业大模型的几种训练策略

文心千帆大模型平台，一站式企业级大模型平台

标签：人工智能深度学习文心一言

随着人工智能技术的不断发展，尤其是深度学习技术的广泛应用，大模型训练已成为当下研究的热点之一，随着计算能力的不断提升和数据规模的不断增加，大模型展现出了惊人的能力，能够处理更加复杂和庞大的任务。...

市场上最强的语言大模型GPT对比全解析

标签： gpt 人工智能神经网络

openAi chagpt 百度文心一言阿里通义千问微软 new bing(基于chatgpt4) 谷歌 bard

llama-factory SFT系列教程 (一)，大模型 API 部署与使用

标签：人工智能自然语言处理

llama-factory 教程，实现大模型 api 部署；使用 llama_factory 的 API 部署有 vllm加速推理；

【大模型】—AI大模型总体概述

标签：人工智能语言模型

本文将对AI大模型进行简要介绍，包括其定义、发展历程以及分类等。

百度智能云“千帆大模型平台”升级，大模型最多、Prompt模板最全—测评结果超预期

标签： prompt 百度智能云千帆大模型

为降低大模型使用门槛，千帆大模型平台将持续汇聚优质的大模型资源，提供易用可靠的大模型工具链，帮助每个企业、开发者打通拥抱大模型的最短路径，共同探索大模型与行业结合的创新实践。海量Prompt模板的推出，...

AI大模型探索之路-训练篇1：大语言模型微调基础认知

标签：人工智能语言模型自然语言处理

这些模型通过在大规模数据集上的预训练过程获得了强大的语言理解和生成能力，使其能够在多种自然语言处理任务中表现出色。然而，由于预训练过程所产生的模型通常具有泛化特性，它们往往无法直接适配到特定的应用场景...

llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署

标签：自然语言处理

本文为 llama-factory SFT系列教程的第二篇；实现了在自定义数据集上 lora 微调大模型；接着融合lora权重进行大模型推理的功能

科普初步了解大模型

标签：语言模型

科普初步了解大模型

”大模型“ 的搜索结果

什么是大模型？一文读懂大模型的基本概念

如何学习训练大模型——100条建议（附详细说明）

“开源 vs. 闭源：大模型的未来发展趋势预测“——探讨大模型未来的发展方向

2022中国大模型发展白皮书.pdf

[LLM]大模型训练DeepSpeed(一)-原理介绍

大模型上下文扩展之YaRN解析：从直接外推ALiBi、位置插值PI、NTK-aware插值、YaRN

AI大模型知识点大梳理

大模型训练大模型训练大模型训练

大模型学习篇(一)：初识大模型

【大模型】大型模型飞跃升级—文档图像识别领域迎来技术巨变

AI：大模型领域最新算法SOTA核心技术要点总结(一直持续更新)、大模型实战与理论经验总结(训练优化+代码实战...

AI大模型探索之路-训练篇3：大语言模型全景解读

AI大模型学习

部署大模型API的实战教程

【LLM】大模型值得探索的十个研究方向

百度智能云“千帆大模型平台”升级，大模型最多，Prompt模板最全

百度智能云：千帆大模型平台接入Llama 2等33个大模型，上线103个Prompt模板

【LLM】大模型幻觉问题的原因和缓解方法

程序员敲代码的“姿势”，正在被大模型改写！

什么是大模型

技术干货｜什么是大模型？超大模型？Foundation Model？

大模型系列｜垂直大模型的几种训练策略（一）

文心千帆大模型平台，一站式企业级大模型平台

市场上最强的语言大模型GPT对比全解析

llama-factory SFT系列教程 (一)，大模型 API 部署与使用

【大模型】—AI大模型总体概述

百度智能云“千帆大模型平台”升级，大模型最多、Prompt模板最全—测评结果超预期

AI大模型探索之路-训练篇1：大语言模型微调基础认知

llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署

科普初步了解大模型

推荐文章