黑头呆鱼进化之旅

Created2024-12-06|NLP Insights

基于生成的大语言模型（LLM）评估：从生成到判断的机遇与挑战摘要人工智能（AI）与自然语言处理（NLP）领域中的评估任务长期面临挑战。传统的评估方法（如基于匹配或嵌入的技术）在判断复杂属性时效果有限。近期大语言模型（LLM）的发展催生了“LLM-as-a-Judge”范式，利用LLM对任务进行评分、排序或选择。本论文对LLM评估方法进行了全面综述，包括其定义、分类框架、评估基准，以及未来的研究方向。 1. 引言1.1 背景评估是机器学习和NLP的核心问题之一，传统评估方法如BLEU和ROUGE通常基于文本重叠，缺乏对复杂场景的适用性。随着深度学习和LLM的发展（如GPT-4），研究者提出了“LLM-as-a-Judge”模式，以解决传统评估的局限。 1.2 研究问题本论文旨在探讨以下问题：评估内容：LLM评估什么？评估方法：如何进行评估？应用场景：LLM在哪里评估？ 2. 预备知识2.1 输入格式评估输入可分为：点对点（Point-Wise）：单个样本评估。对/列表评估（Pair/List-Wise）：多个样本的比较评估。 2.2 输出格式评估输出包括：评分 ...

Reflections on Identity and Subjectivity

Created2024-12-03|Life Reflections

PR Application Rejected: Reflections on Identity and SubjectivityWhen I received the news of my PR application being rejected, after a brief moment of shock, what arose within me was not merely frustration but a peculiar sense of “existential dilemma.” On the surface, it seemed like just an administrative outcome, yet it profoundly mirrored the multiple tensions between the structure of contemporary global mobility and the construction of subjectivity. Amid the tension between globalization and ...

身份与主体性的反思

Created2024-12-03|Life Reflections

永居申请被拒：身份与主体性的反思当我接到永居申请被拒的消息时，短暂的愣神之后，内心涌动的却并非单纯的挫败，而是一种奇异的“生存论困境”感。表面上，这似乎只是一次行政结果的体现，但其背后却深刻折射了当代全球流动性结构与主体性建构之间的多重张力。在全球化与国家主权的张力下，个体身份的确认究竟是否可能？当永居申请被拒时，是否意味着个体被象征性地排除在某种集体意义之外？永居申请：从权利幻想到身份迷宫在吉登斯的“现代性与自我认同”理论框架下，永居申请不仅是一种居留权的争取，更是一种对身份稳定性与未来可能性的符号化追求。然而，在全球化语境下，这种追求往往陷入德里达所描述的“延异”结构：权利的实现总是被推迟，身份的确认总是悬置。在此情境中，申请被拒的结果无异于一种符号暴力。它不仅断裂了我对未来的规划，也撕裂了我在这一场域中的主体性幻象。主体性与制度规训的对抗布尔迪厄的场域理论揭示了权力在社会实践中的分布方式，而永居申请这一制度实践正是权力规训个体的具体化场域。拒绝不仅是一种行政结果，更是一种对主体的隐形规训，暗示了平台资本主义时代个体与制度之间的权力失衡。福柯的规训视角让我们看到 ...

【Leetcode Python题解】「1346. Check If N and Its Double Exist」

Created2024-12-02|Code Chronicles

【Leetcode Python题解】「1346. Check If N and Its Double Exist」题目：1346. Check If N and Its Double Exist题目描述给定一个整数数组 arr，检查是否存在两个不同的索引 i 和 j，满足： i != j 0 <= i, j < arr.length arr[i] == 2 * arr[j] 示例示例 1: 123输入：arr = [10,2,5,3]输出：true解释：对于 i = 0 和 j = 2，arr[i] = 10 等于 2 * 5 = 2 * arr[j] 示例 2: 123输入：arr = [3,1,7,11]输出：false解释：不存在满足条件的 i 和 j。约束条件 2 <= arr.length <= 500 -10³ <= arr[i] <= 10³ 解题思路这道题可以用多种方法解决，我们来分析两种主要的解法：暴力解法和哈希表解法。 1. 暴力解法最直观的解法是使用两层循环，遍历所有可能的数对。 1234567def checkI ...

【Leetcode Python题解】「2097. Valid Arrangement of Pairs」

Created2024-12-01|Code Chronicles

【Leetcode Python题解】「2097. Valid Arrangement of Pairs」在这篇技术博客中，我们将深入解析 LeetCode 的第 2097 题 —— Valid Arrangement of Pairs，并全面介绍如何从题意理解、图论建模到算法实现逐步解决问题。题目：2097. Valid Arrangement of Pairs问题描述给定一个二维数组 pairs，其中 pairs[i] = [start, end]，我们需要重新排列这些数字对，使得相邻的两个数字对 [start1, end1] 和 [start2, end2] 满足以下条件： end1 == start2。输入数据保证一定存在这样一种合法的排列方式。示例示例 1输入： 1pairs = [[5,1],[4,5],[11,9],[9,4]] 输出： 1[[11,9],[9,4],[4,5],[5,1]] 解释：排列后满足条件： end0 = 9 == 9 = start1 end1 = 4 == 4 = start2 end2 = 5 == 5 = start3 示例 ...

Leetcode Python Solution - 2097. Valid Arrangement of Pairs

Created2024-12-01|Code Chronicles

[Leetcode Python Solution] 2097. Valid Arrangement of PairsIn this technical blog, we’ll dive deep into Leetcode Problem 2097 — Valid Arrangement of Pairs. We will break down the solution step by step, from understanding the problem, modeling it as a graph theory problem, to implementing the solution. Problem Link: 2097. Valid Arrangement of Pairs Problem DescriptionGiven a 2D array pairs where pairs[i] = [start, end], you need to rearrange these pairs so that for adjacent pairs [start1, end1] ...

Detailed Explanation of LoRA, DPO, KTO, and SFT Technologies

Created2024-10-23|NLP Insights

Introduction to LLM Training Terminology:LoRA, DPO, KTO, and SFT TechnologiesThis document provides a detailed introduction to several important techniques used in fine-tuning and optimizing large language models (such as LLAMA3), including SFT (Supervised Fine-Tuning), LoRA (Low-Rank Adaptation), Alignment technologies, KTO (Kahneman-Tversky Optimization), and DPO (Direct Preference Optimization). The document also elaborates on the principles of each technique, specific implementation methods, ...

LoRA, DPO, KTO 与 SFT 技术详解

Created2024-10-23|NLP Insights

LoRA, DPO, KTO 与 SFT 技术详解本篇文档将详细介绍几种在大型语言模型（如 LLAMA3）微调和优化中的重要技术，包括 SFT（Supervised Fine-Tuning）、LoRA（Low-Rank Adaptation）、Alignment 技术、KTO（Kahneman-Tversky Optimization）和 DPO（Direct Preference Optimization）。文中还将详细阐述每种技术的原理、具体实现方法以及相应的损失函数与优化器选择。 1. SFT（Supervised Fine-Tuning）1.1 原理SFT 是一种传统的微调方法，通过监督学习对预训练模型进行微调，调整模型的参数使其在特定任务上表现更好。SFT 通常用于针对特定的标注数据进行模型微调，训练的过程类似于常规的监督学习。 1.2 实现方法选择预训练模型：如 GPT、BERT 等语言模型。准备标注数据集：数据集包含输入和输出对。训练模型：使用标准的交叉熵损失函数对模型进行训练，通过梯度下降优化参数。 1.3 核心代码使用 Hugging Face 的 Tra ...

使用压缩有限状态机进行本地 LLM 的快速 JSON 解码

Created2024-08-13|NLP Insights

使用压缩有限状态机进行本地 LLM 的快速 JSON 解码作者: Liangsheng Yin, Ying Sheng, Lianmin Zheng日期: 2024 年 2 月 5 日本文内容基于 LMSYS Org 发布的一篇博客文章，原文链接：LMSYS Org 博客。相关的代码库可以在以下链接找到：SGLang 代码库。让一个 LLM 始终生成符合特定模式的有效 JSON 或 YAML，对于许多应用来说是一个关键特性。在这篇博客文章中，我们介绍了一种显著加速这种约束解码的优化方法。我们的方法利用了压缩的有限状态机，并且兼容任何正则表达式，因此可以适用于任何 JSON 或 YAML 模式。与现有系统逐步解码一个标记的方式不同，我们的方法分析了正则表达式的有限状态机，压缩了单一的转换路径，并在可能的情况下一次性解码多个标记。与最先进的系统（guidance + llama.cpp，outlines + vLLM）相比，我们的方法可以将延迟减少最多 2 倍，并提高吞吐量最多 2.5 倍。这一优化还使得约束解码比普通解码更快。你可以在 SGLang 上试用它。图一展示了 SGL ...

Detailed Steps for Running Fine-tuned Gemma-2-2b-it with vLLM

Created2024-08-07|NLP Insights

In this post, I will share the steps to run the fine-tuned Gemma-2-2b-it model using vLLM. This guide will cover the installation process, environment configuration, and common troubleshooting tips. Installation and Verification of vLLMFirst, ensure that you have installed and verified vLLM version 0.5.3. Install vLLM: 1!pip install vllm==0.5.3 Verify the installation: 123import vllmprint(vllm.__version__)# Output: 0.5.3 Installing FlashinferFollow these steps to install Flashinfer, ensuring ...