RAGFlow-生成式人工智能融入商业领域的平台

374 views

RAGFlow是一个致力于将生成式人工智能融入商业领域的平台，核心是其检索增强生成（RAG）引擎，为企业挖掘潜力提供支持。 1. 核心功能与优势

- **模板化分块**：采用模板化分块技术，具备智能且可解释的特性，能够对复杂格式的非结构化数据进行深度理解，从中精准提取知识，确保高质量的信息处理。
- **兼容多种数据源**：支持Word、幻灯片、Excel、文本、图像、扫描件、结构化数据、网页等多种类型的数据源，满足企业多样化的数据处理需求。
- **减少幻觉**：通过提供依据和引用，可快速查看关键参考资料与可追溯的引用信息，为生成的答案提供坚实依据，有效减少答案中的幻觉现象。

AutoML-视频文字

377 views

AutoML（Automated Machine Learning）旨在通过自动化机器学习流程中的关键步骤，降低技术门槛并提升效率。其核心知识体系涵盖以下核心模块：

一、AutoML核心架构

AutoML Architecture （注：此处可插入典型AutoML系统架构图）

1. 自动化数据预处理

数据清洗增强：自动处理缺失值（插值/删除）、异常检测（Isolation Forest）、数据增强（SMOTE过采样）
特征工程自动化：通过遗传编程自动生成高阶特征组合（如乘除运算），特征选择（LASSO正则化）
类型自动识别：智能识别时间序列、文本（TF-IDF）、图像（自动维度匹配）

2. 智能模型选择

元学习系统：构...

大模型微调-视频文字-

341 views

大模型微调（Fine-tuning）是迁移学习的一种重要技术，其核心思想是在预训练模型（Pre-trained Model）的基础上，通过特定任务的数据对模型参数进行进一步调整，使其适配下游任务。以下是其原理的概述：

1. 预训练阶段

目标：利用大规模无标注数据（如文本、图像等）训练模型，学习通用的特征表示。
方法：常见的预训练任务包括：
自回归语言建模（如GPT系列）：预测下一个词。
自编码语言建模（如BERT）：通过掩码预测（Masked Language Modeling）学习上下文表示。
对比学习（如CLIP）：学习跨模态的语义对齐。
输出：模型具备对输入数据的通用理解能力（...

AnythingLLM一款集成多种功能的AI应用程序

359 views

该网页是AnythingLLM的产品介绍页面，主要宣传其为一款集成多种功能的AI应用程序，具备多方面优势，面向个人和组织用户。

产品定位：一体化AI应用，号称是用户唯一需要的AI应用。支持多种大语言模型（LLM）、处理各类文档，且配备智能代理，强调完全隐私性。适用于Windows、MacOS和Linux系统，由Y Combinator支持。
产品优势
- 安装便捷：一键安装，将所有工具集合成单个桌面应用程序。
- 安全隐私：仅与用户明确连接的服务通信，可在无网络连接下完全在本地运行。
- 模型多样：支持多种模型，如微软Azure上的企业GPT模型；OpenAI的GPT - 3、GPT - 4及...

控制逻辑

376 views

控制逻辑是指在控制系统中，用于实现对被控对象的控制和调节所遵循的逻辑规则和方法，以下是关于它的详细介绍：

基本概念

控制逻辑规定了控制器如何根据输入信号（如传感器检测到的系统状态信息）来产生相应的控制输出，以达到使被控对象按照期望的方式运行的目的，它是控制系统的核心，决定了系统的性能和行为。

常见类型

开关控制逻辑：这是一种最基本的控制逻辑，也称为二位控制逻辑。它根据被控量与设定值的比较结果，将控制输出设置为全开或全关两种状态。例如，常见的温度控制系统中，当温度低于设定值时，加热设备全开；当温度高于设定值时，加热设备全关。这种控制逻辑简单直接，但可能会导致系统在设定值附近产生频繁的开关...

端口访问检测

356 views

端口访问检测是检查特定网络端口是否开放并可被访问的过程，常用于排查服务连通性或网络安全问题。以下是详细的检测方法及步骤：

一、常用检测工具

1. Telnet

命令：telnet [IP或域名] [端口]
结果：
- 连接成功：端口开放。
- 连接被拒绝：端口未开放或服务未运行。
- 超时：可能被防火墙拦截。
注意：若未安装 Telnet，需通过包管理器安装（如 apt install telnet 或 yum install telnet）。

2. Netcat (nc)

TCP检测：nc -zv [IP] [端口]
UDP检测：nc -zuv [IP] [端口]
结果：显示 succ...

自动微分

419 views

Automatic differentiation（自动微分）是一种在计算机科学和数学领域中用于高效计算函数导数的技术，以下是关于它的详细介绍：

定义

自动微分是一种能够自动计算函数导数的方法，它基于计算机程序对函数表达式的解析和计算，利用链式法则等数学原理，将复杂函数的求导过程分解为一系列基本操作的求导组合，从而实现对函数导数的快速、准确计算。

原理

正向累积：从自变量开始，按照函数的计算顺序，依次计算每个中间变量的导数，并将这些导数信息逐步累积，最终得到目标函数对自变量的导数。例如，对于函数(y = f(g(x)))，先计算(g(x))关于(x)的导数(g'(x))，再计算(f(u...

资本的规则II

357 views

结构化剪枝

371 views

结构化剪枝也是模型剪枝技术中的一种，和非结构化剪枝相对应，以下是关于它的具体介绍：

定义

结构化剪枝是一种在神经网络模型压缩中，以特定结构为单位对模型进行剪枝的方法。它不是像非结构化剪枝那样针对单个参数进行操作，而是对模型中的具有一定结构的组件，如卷积核、通道、神经元等进行整体删除或调整，从而在减少模型复杂度的同时，尽量保持模型的性能。

实现方式

卷积核剪枝：在卷积神经网络中，卷积核是提取特征的关键组件。卷积核剪枝就是根据一定的标准，直接删除整个卷积核。例如，可以计算每个卷积核的重要性得分，这个得分可以基于卷积核的参数幅度、对特征提取的贡献等因素来确定。然后，将得分低于某个阈值的卷积核...

非结构化剪枝

357 views

非结构化剪枝是模型压缩和优化领域中的一种重要技术，以下是关于它的详细介绍：

定义

非结构化剪枝是一种对神经网络模型进行剪枝的方法，它不依赖于特定的结构或模式，而是直接对模型中的参数进行操作。通过去除神经网络中对模型性能影响较小的连接或参数，以达到减少模型存储需求、降低计算量和提高推理速度等目的，同时尽量保持模型的准确性。

实现方式

基于幅度的剪枝：这是一种最常见的非结构化剪枝方法。其核心思想是根据参数的绝对值大小来决定是否剪枝。通常会设定一个阈值，将绝对值小于该阈值的参数直接设置为零。例如，在一个卷积神经网络中，对于卷积层的权重参数，会遍历每个参数，若其绝对值小于给定阈值，如0.01，...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

RAGFlow-生成式人工智能融入商业领域的平台

AutoML-视频文字

一、AutoML核心架构

1. 自动化数据预处理

2. 智能模型选择

大模型微调-视频文字-

1. 预训练阶段

AnythingLLM一款集成多种功能的AI应用程序

控制逻辑

基本概念

常见类型

端口访问检测

一、常用检测工具

1. Telnet

2. Netcat (nc)

自动微分

定义

原理

资本的规则II

结构化剪枝

定义

实现方式

非结构化剪枝

定义

实现方式