分类目录归档:人工智能

ML的三个步骤


这张图片展示了机器学习(Machine Learning)的三个步骤: 1. Step 1: function with unknown(第一步:定义未知函数) - 这一步是机器学习的开始,通常涉及到确定一个需要通过数据来学习的未知函数。这个函数可能是一个预测模型,例如线性回归、逻辑回归等。 2. Step 2: define loss from training data(第二步:从训练数据中定义损失) - 在这一步,需要从训练数据中定义一个损失函数。损失函数用于衡量模型预测值与真实值之间的差异。常见的损失函数有均方误差(MSE)、交叉熵(Cross - Entropy)等...

Read more

预训练文本模型


Pre-trained text model即预训练文本模型,是一种在大规模文本数据上进行无监督学习得到的语言模型,以下是关于它的详细介绍:

基础概念

  • 定义:预训练文本模型是基于大量无标注文本数据进行预训练的深度学习模型,通过学习语言的统计规律、语法结构和语义表示,为各种自然语言处理任务提供强大的基础.
  • 训练方式:预训练模型的训练过程通常分为两个阶段,即预训练和微调。在预训练阶段,模型使用大量的无标签文本数据,通过自监督学习的方式进行训练,学习语言的一般特征和模式 。预训练完成后,模型可以通过微调适应特定的下游任务,即在具体任务的标注数据上对预训练模型进行有监督学习,通过对模型参数进行...

Read more

文字生成视频


文生视频(文字生成视频)是一种新兴的人工智能技术应用。

原理及实现方式

它主要依靠深度学习算法和大规模的数据集进行训练,让模型能够理解文字所表达的场景、动作、人物、情感等各类关键要素,然后依据这些理解去生成对应的视频内容。例如,输入一段描述“阳光明媚的海边,海浪轻轻拍打着沙滩,有几个人在悠闲地散步”,模型会尝试提取其中海边、海浪、沙滩、散步的人等元素,通过合成相应的图像画面,并按照合理顺序编排以及添加适当的动态效果,组合成一个视频呈现出来。

应用场景

  • 影视创作领域:创作者可以用文字快速勾勒出故事的大致画面,辅助进行前期的创意构思和分镜头脚本创作,帮助更快地呈现脑海中的设想,看看整体视觉...

Read more

跨语言能力-ML


一、定义

“Cross - linguistic competence”指的是跨语言能力。它是个体在掌握多种语言的过程中所具备的一种综合能力,这种能力使使用者能够在不同语言之间灵活切换、比较、迁移知识,并且利用对一种语言的理解来辅助对另一种语言的学习、理解和运用。

二、组成部分

  1. 语言知识迁移能力
  2. 例如,一个掌握了英语和法语的人,在学习语法时,可能会发现法语中的性数配合规则(如名词的性有阳性和阴性之分,形容词要和名词的性数保持一致)和英语中的名词单复数以及代词和名词的一致关系有一定的相似性和差异。他们能够将在英语语法学习中获得的关于句子成分、词序等知识迁移到法语学习中,比如英语句子基本结...

Read more

领域对抗训练


Domain Adversarial Training(领域对抗训练)是一种在机器学习,特别是深度学习领域中用于处理领域自适应(Domain Adaptation)问题的技术。

一、背景和目的

在许多实际应用场景中,我们可能会遇到训练数据和测试数据来自不同分布的情况,这被称为领域漂移(Domain Shift)。例如,在图像分类任务中,训练图像可能是在清晰天气下拍摄的,而测试图像是在有雾天气下拍摄的;或者训练数据是来自某一个特定的数据集(如MNIST手写数字数据集),而实际应用场景中的数据来自另一个具有不同统计特性的数据集。这种分布差异会导致模型在测试数据上性能下降。Domain Adv...

Read more

机器学习的分类


机器学习主要可以分为以下几类:

  1. 监督学习(Supervised Learning)

    • 定义:监督学习是指利用标记(label)好的训练数据来学习一个模型,模型的目标是尽可能准确地预测新数据的标签。训练数据集中的每个样本都包含输入特征和对应的目标标签。
    • 分类(Classification)
      • 二分类(Binary Classification):将数据分为两个类别。例如,在垃圾邮件检测中,邮件被分为“垃圾邮件”和“非垃圾邮件”两类;在疾病诊断中,患者被判断为“患病”或“未患病”。典型的算法包括逻辑回归(Logistic Regression)、支持向量机(Support Vector M...

Read more

MLOps-知识体系-全景图


  • ML 生命周期

以下是一个较为常见的MLOps(机器学习运维)知识体系全景图的大致介绍:

数据管理

  • 数据采集:从各种数据源(如传感器、数据库、文件系统、网络爬虫等)收集原始数据,确保数据的质量和完整性在这一环节有基本把控,例如去除明显错误或重复的数据记录。
  • 数据清洗与预处理:处理缺失值、异常值,进行数据标准化、归一化等操作,让数据符合后续机器学习模型训练的要求,像将图像数据统一尺寸等。
  • 数据标注(若需要):对于有监督学习任务,通过人工标注或者利用标注工具、众包平台等方式给数据添加合适的标签,比如给图像中的物体标注类别名称。
  • 数据版本控制:类似代码版本控制,跟踪数据的不同版本变化,便...

Read more

随机相位生成


  1. 定义
  2. 随机相位生成(Random Phase Generation)是指创建具有随机相位值的过程。在信号处理、光学、量子物理等众多领域都有应用。相位是描述周期性现象(如正弦波、电磁波等)的一个重要参数,它决定了信号在时间或空间中的相对位置。随机相位生成主要是为了引入不确定性或者多样性到信号或波的表示中。
  3. 方法
  4. 均匀分布随机数法(基于概率分布)
    • 一种常见的方法是利用均匀分布的随机数来生成随机相位。在数学上,相位通常用弧度来表示,范围是([0, 2\pi))。可以使用一个能够生成均匀分布在([0,1])区间的随机数生成器,将生成的随机数(r)乘以(2\pi),得到的结果就是一个在([0, ...

Read more

时域反演


  1. 定义
  2. 时域反演(Time - Domain Inversion)是一种信号处理和地球物理领域广泛使用的技术。从广义上来说,它是一种通过对观测到的时域信号进行逆向操作,以推断产生这些信号的系统特性或源信息的方法。在地球物理勘探中,例如地震勘探,时域反演主要用于根据地面接收到的地震波信号(时间序列数据)来反推地下地质结构的特性,如速度、密度等参数。
  3. 基本原理
  4. 正向问题与反向问题
    • 首先要理解正向问题,即已知地下地质结构(包括介质的速度、密度等参数)和震源的位置及激发方式,通过波动方程(如弹性波方程)来计算地面或其他观测点处接收到的地震波信号的时间序列和波形。而时域反演则是反向问题,是在已知...

Read more