作者文章归档：course

幻觉-LLM-AI

218 views

在语言模型（LLM）领域，“幻觉”是一个重要的概念。

一、定义

LLM的幻觉是指模型生成的内容包含事实错误或不符合实际逻辑，但看起来却像是合理的表述。例如，模型可能会编造不存在的事件、引用错误的统计数据或者给出与已知知识相矛盾的解释。

二、产生原因

训练数据问题
- 数据不准确或过时：如果训练数据包含错误信息，那么模型可能会学习到这些错误并在生成内容时表现出来。比如，在一些过时的文献中存在错误的科学理论，当这些文献作为训练数据时，模型可能会产生基于这些错误理论的内容。
- 数据偏差：当训练数据存在某种偏向性时，模型也会受到影响。例如，数据集中大部分内容是关于某个特定观点的，模型可能会过度倾向于...

元数据Metadata-ML-AI

261 views

在机器学习（Machine Learning）中，元数据（Metadata）是非常重要的一个概念。

一、定义和基本概念

元数据本质上是“关于数据的数据”。它提供了有关机器学习中所使用数据的额外信息，这些信息本身不是原始数据的内容，但对于理解、处理和评估数据以及模型训练过程至关重要。例如，对于一个图像数据集，图像本身的像素值是数据，而图像的拍摄日期、拍摄设备、图像所属类别标签等信息就是元数据。

二、元数据的类型

数据来源相关元数据
- 数据源信息：描述数据是从哪里收集的。例如，数据是来自特定的传感器（如气象数据来自气象站的温度、湿度传感器）、特定的网站（如电商平台的用户评论数据）还是其他渠道...

格式化提示format prompt-LLM

213 views

在生产环境下的大语言模型（LLM）中，“格式化提示（format prompt）”包含以下几个关键要点：

提示的清晰性与明确性

清晰表述任务或问题：提示需要清楚地说明期望大语言模型去完成的任务或解答的问题。比如，不能只是模糊地说“给我讲讲某件事”，而应更具体地表述为“详细描述光合作用的过程”。
避免歧义：要是想让大语言模型生成故事，就要明确指定故事的类型（例如“写一篇关于时空旅行的科幻短篇小说”）、篇幅长度（比如“写一篇500字的故事”）以及其他相关细节，像目标受众（例如“为中学生写一篇关于英雄冒险的故事”）等内容。

针对大语言模型的输入格式化

遵循编码标准：在文本类大语言模型中，...

财联社 app -财经领域的专业资讯平台

752 views

财联社 app 是一款专注于财经领域的专业资讯平台，以下是对它的详细介绍：

基本信息

所属公司：由上海界面财联社科技股份有限公司开发运营，其背后有上海报业集团及多家资本的支持.
上线时间：2015年3月正式上线.
用户规模：移动端用户超过100万，日活跃用户数高达50万，总覆盖投资者人群过亿.

产品定位与准则

定位为高素质人群聚集的新闻及商业社交平台，主要面向证券领域的投资者，为他们提供有价值的金融信息服务.
遵循“准确、快速、权威、专业”的新闻准则，致力于打造成为投资者信赖的财经资讯来源.

主要功能与内容

24小时电报：作为核心功能，全面监控全球3000多家信息源，对实时新闻...

在行 App-知识技能共享平台

449 views

在行 App 是由果壳网于2015年孵化的一款知识技能共享平台，后获得腾讯、红杉、元璟等知名风险资本投资.以下是对它的具体介绍：

平台优势

海量行家资源：拥有超过一万名来自知名互联网公司、世界五百强的职场牛人，以及律师、心理咨询师等超过70余类行家入驻，这些行家覆盖了行业经验、个人成长、职业规划、投资理财、市场公关、健康管理、生活方式等众多领域，能够为用户提供丰富多样的专业知识和经验分享.
个性化指导：用户可以根据自己的困惑选择相匹配的专家，通过线下约聊或者全国远程通话服务，一对一地获得个性化指导，这种方式能够针对用户的具体问题提供更具针对性和实用性的解决方案，帮助用户更好地解决问题...

短线选股流程-Stock

326 views

短线选股（即日内交易或短期持股）的选股流程主要依赖于技术分析和市场情绪，而非基本面的深入分析。其目的是在短期内抓住股价的波动，通常是在一天内买入并卖出股票，因此需要快速反应、准确判断市场趋势。以下是一个典型的短线选股流程，适合今天买、明天卖的策略：

1. 明确短线交易目标

在短线交易中，最重要的是明确你的目标——抓住短期股价波动。因此，你的投资策略和选股方式都需要快速、灵活。例如，目标可以是： - 赚取股价的快速波动（如1%-5%的波动） - 按时卖出，避免持股过长时间 - 根据市场消息或技术信号快速决策

2. 筛选潜力股

快速筛选出适合短线交易的潜力股票是选股的第一步...

推理-提示体工程

242 views

在提示体工程（Prompt Engineering）中，“推理”（inferring）通常指的是根据给定的提示或上下文信息，模型自动推导出隐含的结论或答案。这与传统的基于规则的推理方法不同，提示体工程依赖于大语言模型（如GPT系列）从大量数据中学习的能力，通过对提示的理解和推断，生成合理的输出。

在提示体工程中的推理有以下几个方面：

上下文推理：
模型基于给定的上下文和提示进行推理，理解隐含信息。例如，在对话系统中，模型可以根据先前的对话内容推测用户的意图，并作出合理回应。
例子：如果用户问“明天的天气怎么样？”，模型推理出用户是在询问某个地点的天气，可能需要根据地理信息推断出该地区...

长文本摘要总结-AI

256 views

大语言模型（LLM）在长文本摘要总结方面的应用通常包括对长文档的提取性总结和抽象性总结。以下是这两种方法的解释及其在LLM中的实现方式：

1. 提取性总结（Extractive Summarization）

定义：提取性总结是从原始长文本中直接提取关键句子或段落，重新组织并形成简洁的总结。这种方法不改变原文的内容，而是选择最能代表原文的句子。
过程：
- LLM通过识别文本中的重要信息来提取出关键词或关键句子。
- 这些句子被直接用作总结的一部分，保留原文中的信息而不进行修改。
优点：
- 保持原文的准确性。
- 处理速度较快，因为只需从原文中提取内容。
缺点：
- 可能导致不连贯的总结，因为提取...

云-价格对比-比价网

288 views

以下是常见云提供商的云主机包年包月价格表格，价格仅供参考，实际价格可能因配置、地域、促销活动等因素有所不同：

云主机类型	配置	阿里云	腾讯云	华为云	京东云	百度智能云	天翼云
轻量应用服务器	2核2G 3M带宽 50GB高效云盘	108元/年	61元/年新用户68元/年	61元/年	50元/年	48元/年	-
轻量应用服务器	2核2G 4M带宽	-	79元/年	-	-	-	-
轻量应用服务器	2核4G 5M带宽	297.98元/年	252元/15个月 756元/3年	-	-	-	-
ECS云主机	2核2G 3M带宽	99元/年（ECS经济型...

魔方建站网-低代码平台

227 views

http://www.mofine.cn/是魔方建站网的官方网站。

魔方建站网是一个提供网站建设全程化服务的智能建站平台，具有以下特点和功能： - 提供多种建站方式，包括企业官网、手机官网、微信官网、响应式建站、五合一建站、建站保姆、云站群等。 - 支持PC+手机+微信网站+小程序+APP五站合一，实现全渠道覆盖。 - 一键生成小程序，畅享流量红利，轻松打造微信营销新生态。 - 拥有B2C电商系统，可快速搭建独立的品牌商城网站，具备会员管理、商品管理、订单管理、物流配送等功能，并能利用微信社交关系快速发展SDP分销商，实现裂变式传播的销售模式。 - 有丰富多样的互动营销应用插件，如优惠折...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。