MaXiaoTiao
Always like this.
Home
Archives
Categories
Label
Moments
Photos
Link
About
最新文章
阿里魔塔(Model Scope)微调流程
阿里魔塔(Model Scope)微调流程 1.选择模型 在模型库首页 · 魔搭社区选择所需的模型,在这里,选择的模型为零一万物的Yi-1.5-6B模型
学习
2024-10-31
DPO算法
DPO算法 DPO(Distributed Proximal Policy Optimization)算法是一种用于强化学习的优化算法,它是PPO(Proximal Policy Optimization)算法的分布式版本。DPO算法主要用于解决在多智能体环境中或者在需要并行计算的场景下,如何高效地
学习
2024-09-24
PPO算法
PPO算法 PPO(Proximal Policy Optimization)算法是一种用于强化学习的优化算法,它旨在解决策略梯度方法中的样本效率问题。PPO算法是由OpenAI团队在2017年提出的,它结合了传统策略梯度方法(如REINFORCE)和信赖域方法(如TRPO)的优点,是目前应用非常广
学习
2024-09-24
容器和虚拟机有什么区别?
容器和虚拟机有什么区别? 容器和虚拟机(VM)都是用来隔离应用和服务的工具,但它们的工作方式和资源使用上有一些关键的区别: 操作系统: 虚拟机:每个虚拟机都需要安装一个完整的操作系统。这意味着每个虚拟机都会有自己的操作系统内核,以及一系列的用户空间应用程序。 容器:容器不需要独立的操作系统,它们共享
学习
2024-09-23
Poetry
Poetry Poetry 是什么 Poetry 是一个用于 Python 编程语言的依赖管理和打包工具。它旨在帮助开发者在开发 Python 应用时更好地管理项目依赖、打包和发布。Poetry 主要具有以下特点: 依赖管理:Poetry 通过 pyproject.toml 文件统一管理项目依赖,这
学习
2024-09-14
Prompt Engineering
Prompt Engineering 1. Prompt Engineering 的意义 LLM 时代 prompt 这个词对于每个使用者和开发者来说已经听得滚瓜烂熟,那么到底什么是 prompt 呢?简单来说,prompt(提示)就是用户与大模型交互输入的代称。即我们给大模型的输入称为 Promp
2024-09-13
开发 LLM 应用的整体流程
开发 LLM 应用的整体流程 一、何为大模型开发 我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。开发大模型相关应用,其技术核心点虽然在大语言模型上,但一般通过调用 API 或开源模型来实现核心的理解与生成,通过
学习
2024-09-13
上一页
下一页