作者文章归档:course

自动推理


自动推理是人工智能领域的一个关键部分,它涉及让计算机系统根据给定的知识和规则自动地推导出新的结论或判断。

一、自动推理的基本原理

  1. 基于规则的推理
  2. 这是最常见的推理方式之一。它依赖于预先定义的规则集,就像产生式系统中的规则“如果……那么……”。例如,在一个简单的故障诊断系统中,规则可能是“如果设备发出异常噪音并且温度过高,那么设备可能存在机械故障”。当系统检测到设备有异常噪音和过高的温度这些前提条件时,就会根据规则推导出设备可能有机械故障的结论。
  3. 规则的表示形式可以是逻辑公式,如一阶谓词逻辑规则。这些规则能够精确地描述知识之间的因果关系和逻辑约束,为推理提供明确的依据。
  4. 基于模型的推理
  5. ...

Read more

知识表示


知识表示是人工智能领域中的一个重要概念,它是指将知识以一种计算机可以理解和处理的形式进行表达的方法和技术。

一、知识表示的目的

  1. 知识存储
  2. 方便将大量的知识有效地存储在计算机的存储系统中。例如,在一个医学知识库中,存储各种疾病的症状、诊断方法、治疗方案等知识,通过合适的知识表示可以使这些知识有条理地存放,便于后续的查询和更新。
  3. 知识共享和交流
  4. 不同的人工智能系统或者软件之间可以通过统一的知识表示形式来共享知识。就像不同的医疗机构之间,如果都采用相同的知识表示标准来记录和交换医学知识,那么在医疗研究和实践合作中就能够更好地沟通交流。
  5. 知识利用
  6. 让计算机能够利用这些知识进行推理、决策等操作。...

Read more

自动备份博客系统-Cases


外网博客数据备份与传输到内网自动化方案

一、方案概述

本方案旨在实现外网博客系统数据的定期自动备份,并将备份文件安全传输至内网环境,同时清理外网过期备份文件以节省空间,确保数据的安全性和完整性。

二、具体步骤

(一)准备工作

  1. 确定外网博客数据目录,例如 /var/www/html/blog(根据实际情况修改)。
  2. 在外网服务器上创建备份文件存储目录,如 /backup,并确保运行脚本的用户具有该目录的读写权限。
  3. 在内网服务器上创建接收备份文件的目录,如 /backup,并配置好相应的权限,以允许外网服务器的用户写入文件。
  4. 确保外网服务器已安装 tarscp 命令,且内外网之间网络配...

Read more

网络爬虫


一、爬虫基础概念

  1. 定义
  2. 网络爬虫(Web Crawler)也叫网页蜘蛛(Web Spider),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。它的主要目的是从互联网上获取数据,这些数据可以用于数据分析、搜索引擎索引构建、市场情报收集等诸多用途。
  3. 例如,搜索引擎(如百度、谷歌)就使用爬虫程序来遍历网页,收集网页的文本内容、链接等信息,以便用户进行搜索时能够提供相关的网页结果。

  4. 工作原理

  5. 发送请求:爬虫首先会向目标网站的服务器发送HTTP请求,请求的类型通常有GET(用于获取网页内容)、POST(用于提交数据,如表单数据)等。就像我们在浏览器中输入网址并请求打开网页一样...

Read more

估计置信度


一、定义

“Estimate confidence”(估计置信度)主要是在统计学和机器学习等领域中使用的概念。它是指对某个估计结果(如参数估计、预测结果等)的可靠性或确定性程度的一种量化评估。

例如,在市场调研中,我们通过抽样调查来估计某产品的市场占有率。除了得到一个占有率的估计值(如30%)之外,还需要知道这个估计有多大的可信度,这就是估计置信度要解决的问题。

二、统计中的置信区间与置信水平

  1. 置信区间(Confidence Interval)
  2. 这是估计置信度的一种常见方式。它是一个区间范围,用于包含我们所估计的参数真实值。例如,我们要估计一个总体均值,通过样本数据计算出一个置信区间,...

Read more

开放集识别


一、定义

Open - set recognition(开放集识别)是一种在计算机视觉、模式识别等领域中使用的概念。它主要处理的情况是在训练阶段和测试阶段的数据分布不同,测试阶段会出现训练阶段没有见过的类别(即未知类别)的数据。

传统的分类任务(如闭集分类)假设测试数据中的类别都是在训练数据中出现过的,而开放集识别则更贴近现实世界的复杂情况。例如,在一个人脸识别系统的训练过程中,我们只使用了公司内部员工的人脸图像进行训练。但在实际使用场景中,可能会有外来人员(未知类别)出现在摄像头前,开放集识别就是要在识别出已知员工的同时,能够判断出未知人员。

二、关键要素

  1. 已知类别(Known Cl...

Read more

问题表述


一、定义

Problem formulation(问题表述)是指将一个实际的复杂问题进行清晰、准确、完整的定义和描述的过程。它是解决问题的关键第一步,目的是把模糊的、笼统的问题情境转化为具体的、可操作的问题陈述,以便于后续选择合适的方法来解决问题。

例如,一家企业发现销售额在下降,这是一个比较笼统的问题描述。通过问题表述,可以将其转化为更具体的内容:“在过去6个月内,企业在A、B、C三个主要销售区域的销售额分别下降了10%、15%和20%,需要分析销售额下降的原因,是市场竞争加剧、产品质量下降、营销策略失误还是其他因素,并提出相应的解决方案。”

二、重要性

  1. 聚焦问题核心
  2. 问题表述能够帮...

Read more

网络入侵检测


一、定义

Network intrusion detection(网络入侵检测)是一种用于监控计算机网络活动,识别任何试图破坏网络安全、未经授权访问网络资源或者恶意利用网络漏洞的安全技术。它的主要目的是在入侵行为对网络系统造成严重损害之前检测并发出警报,同时也可以协助收集有关入侵活动的证据。

例如,当外部攻击者试图通过端口扫描来寻找网络系统中的开放端口,以便后续发动攻击时,网络入侵检测系统可以检测到这种异常的扫描行为,并提醒网络管理员采取相应的防范措施。

二、工作原理

  1. 基于特征的检测(Signature - based Detection)
  2. 这种方法依赖于已知的攻击模式或“特征(Sig...

Read more

异常检测-ML


一、定义

Anomaly detection(异常检测)是指在数据集中识别与正常行为模式或预期模式显著不同的数据点或模式的过程。这些异常点可能代表了系统中的错误、故障、欺诈行为、安全漏洞或者其他罕见但具有重要意义的事件。

例如,在网络流量监测中,正常情况下流量的大小、频率和流向等都有一定的规律。如果突然出现大量的数据传输到一个异常的外部服务器,这就可能是数据泄露的异常行为;在工业生产中,机器正常运转时的温度、振动频率等参数在一个合理的范围内波动,当这些参数出现明显偏离正常范围的情况时,可能意味着机器出现故障。

二、应用场景

  1. 金融领域
  2. 信用卡欺诈检测:银行会记录每一笔信用卡交易的信息,包...

Read more