Published onOctober 15, 2024OpenAI 提示工程指南以及meta-prompt示例translationapplied-llmprompting本文主要介绍了如何使用 OpenAI 提供的提示工程指南以及其 Playground 中用于生成系统提示词的meta-prompt结构。
Published onSeptember 14, 2024【译】特定任务的LLM评估的有效和无效方法translationapplied-llmevals本文主要讨论了如何评估大型语言模型(LLM)在特定任务(分类、提取、摘要、翻译、版权和毒性)上的表现,并提供了一系列的评估方法和工具。
Published onSeptember 14, 2024【译】构建生成式 AI 平台概述translationapplied-llm本文主要介绍了构建和部署生成式 AI 应用程序的整体架构,包括增强上下文、安全保护、模型路由和网关、减少延迟、复杂逻辑和操作以及可观测性和管道编排。
Published onSeptember 13, 2024【译】我们从与LLMs一起建设的一年中学到了什么 – 应用 LLMstranslationapplied-llm本文主要分享了一年来在构建基于大型语言模型(LLMs)产品过程中的实践经验和教训,涵盖了从实际操作到战略规划的各个方面。
Published onSeptember 13, 2024【译】你的 AI 产品需要评估translationapplied-llmevals本文通过一个关于不动产 AI 助手 “Lucy” 的案例研究,展示了如何通过系统的评估方法来突破产品发展的瓶颈。他提出了三个层次的评估体系:单元测试、人工和模型评估以及 A/B 测试。
Published onSeptember 13, 2024【译】提示基础及其有效应用translationapplied-llmprompting本文详细介绍了如何设计和应用有效的提示(prompts)来提高大型语言模型(LLM)的性能。作者强调了提示工程的重要性,并提供了多种技术和最佳实践,例如通过为 LLM 分配特定角色和责任来引导其输出内容、使用结构化输入和输出来提高解析和集成的效率、以及通过链式思考(CoT)来增强模型的推理能力。
Published onSeptember 13, 2024【译】LLM三角原则:构建可靠的人工智能应用程序translationapplied-llm本文主要介绍了构建可靠 AI 应用的 LLM 三角原则,即标准操作程序(SOP)、工程技术和上下文数据,以及如何选择合适的模型,这些原则旨在帮助开发者设计和实现高性能的基于大型语言模型(LLM)的应用程序。
Published onJuly 7, 2024【译】LLM中的外部幻觉translationapplied-llm本文主要探讨了大型语言模型(LLMs)中的外在幻觉问题,包括幻觉的原因、检测方法以及减少幻觉的策略,并提供了相关的评估基准和引用。
Published onJanuary 17, 2024【译】使用 AlphaCodium 的最先进代码生成 - 从提示工程到流程工程translationapplied-llm本文主要介绍了 AlphaCodium,一种新的基于流程迭代的代码生成方法,它通过测试驱动的多阶段流程,显著提高了大型语言模型(LLMs)在代码问题解决方面的表现,尤其是在处理复杂的编程竞赛问题时。
Published onJanuary 7, 2024【译】用于构建高级RAG的速查表和一些配方translationRAGapplied-llmTranslation of the article "A Cheat Sheet and Some Recipes for Building Advanced RAG" by Andrei
Published onJanuary 6, 2024【译】高级RAG技术:图解概述translationRAGapplied-llmTranslation of the article "Advanced RAG Techniques An Illustrated Overview" by Erika Cardenas.