分类目录归档:人工智能

AI知识体系中的365个关键字


以下是一份按照重要程度大致列出的AI知识体系中的365个关键字:

一、基础概念(1 - 100)

  1. 人工智能
  2. 机器学习
  3. 深度学习
  4. 神经网络
  5. 算法
  6. 数据挖掘
  7. 数据分析
  8. 大数据
  9. 特征工程
  10. 标签
  11. 训练集
  12. 测试集
  13. 验证集
  14. 过拟合
  15. 欠拟合
  16. 模型评估
  17. 准确率
  18. 召回率
  19. F1值
  20. 均方误差(MSE)
  21. 交叉验证
  22. 超参数
  23. 参数调整
  24. 向量
  25. 矩阵
  26. 张量
  27. 激活函数
  28. Sigmoid函数
  29. ReLU函数
  30. Tanh函数
  31. 损失函数
  32. 对数损失
  33. 交叉熵损失
  34. 优化算法
  35. 随机梯度下降(SGD)
  36. Adagrad
  37. Adadelta
  38. Adam
  39. 正则化
  40. L1正则化
  41. L2正则化
  42. Dropout
  43. 批归一化(Batch Normalization...

Read more

Gemini-LLM


Gemini是谷歌推出的一款具有划时代意义的大语言模型,旨在为用户提供更加智能、高效的交互体验。它展现了卓越的多模态交互能力和出色的性能表现,能够处理文本、图像、音频等多种输入,为用户带来更加丰富的互动方式。以下是关于Gemini的详细介绍:

Gemini的主要功能

  • 多模态交互能力:Gemini能够处理文本、图像、音频等多种输入,提供丰富的互动方式。
  • 自然语言处理能力:具备强大的自然语言处理能力,能够理解并生成高质量的文本内容。
  • 图像和音频处理:内置的多种模型规格,包括Ultra、Pro和Nano,满足了不同场景下的应用需求。
  • 智能扩展程序:提供免费图片生成和智能扩展程序等功能。

G...

Read more

专家混合-MoE


专家混合(Mixture of Experts,简称 MoE) 是一种在机器学习领域尤其是深度学习中较为常用的模型架构设计理念与技术。

基本原理

  • 它由多个“专家”(通常是神经网络模块,比如多个小型的神经网络)组成,每个专家都专注于处理输入数据的某个特定方面或者某个局部模式。同时,还有一个“门控”(gating)机制,这个门控机制会根据输入数据的特征来决定让哪些专家参与对当前输入的处理以及每个专家参与处理的程度(也就是分配不同的权重)。

例如,想象有一个识别不同动物图像的任务,有几个专家分别擅长识别猫、狗、鸟等。当一张猫的图片输入进来时,门控机制经过判断后,会更多地让擅长识别猫的那个专...

Read more

ML的三个步骤


这张图片展示了机器学习(Machine Learning)的三个步骤: 1. Step 1: function with unknown(第一步:定义未知函数) - 这一步是机器学习的开始,通常涉及到确定一个需要通过数据来学习的未知函数。这个函数可能是一个预测模型,例如线性回归、逻辑回归等。 2. Step 2: define loss from training data(第二步:从训练数据中定义损失) - 在这一步,需要从训练数据中定义一个损失函数。损失函数用于衡量模型预测值与真实值之间的差异。常见的损失函数有均方误差(MSE)、交叉熵(Cross - Entropy)等...

Read more

预训练文本模型


Pre-trained text model即预训练文本模型,是一种在大规模文本数据上进行无监督学习得到的语言模型,以下是关于它的详细介绍:

基础概念

  • 定义:预训练文本模型是基于大量无标注文本数据进行预训练的深度学习模型,通过学习语言的统计规律、语法结构和语义表示,为各种自然语言处理任务提供强大的基础.
  • 训练方式:预训练模型的训练过程通常分为两个阶段,即预训练和微调。在预训练阶段,模型使用大量的无标签文本数据,通过自监督学习的方式进行训练,学习语言的一般特征和模式 。预训练完成后,模型可以通过微调适应特定的下游任务,即在具体任务的标注数据上对预训练模型进行有监督学习,通过对模型参数进行...

Read more

文字生成视频


文生视频(文字生成视频)是一种新兴的人工智能技术应用。

原理及实现方式

它主要依靠深度学习算法和大规模的数据集进行训练,让模型能够理解文字所表达的场景、动作、人物、情感等各类关键要素,然后依据这些理解去生成对应的视频内容。例如,输入一段描述“阳光明媚的海边,海浪轻轻拍打着沙滩,有几个人在悠闲地散步”,模型会尝试提取其中海边、海浪、沙滩、散步的人等元素,通过合成相应的图像画面,并按照合理顺序编排以及添加适当的动态效果,组合成一个视频呈现出来。

应用场景

  • 影视创作领域:创作者可以用文字快速勾勒出故事的大致画面,辅助进行前期的创意构思和分镜头脚本创作,帮助更快地呈现脑海中的设想,看看整体视觉...

Read more

跨语言能力-ML


一、定义

“Cross - linguistic competence”指的是跨语言能力。它是个体在掌握多种语言的过程中所具备的一种综合能力,这种能力使使用者能够在不同语言之间灵活切换、比较、迁移知识,并且利用对一种语言的理解来辅助对另一种语言的学习、理解和运用。

二、组成部分

  1. 语言知识迁移能力
  2. 例如,一个掌握了英语和法语的人,在学习语法时,可能会发现法语中的性数配合规则(如名词的性有阳性和阴性之分,形容词要和名词的性数保持一致)和英语中的名词单复数以及代词和名词的一致关系有一定的相似性和差异。他们能够将在英语语法学习中获得的关于句子成分、词序等知识迁移到法语学习中,比如英语句子基本结...

Read more

领域对抗训练


Domain Adversarial Training(领域对抗训练)是一种在机器学习,特别是深度学习领域中用于处理领域自适应(Domain Adaptation)问题的技术。

一、背景和目的

在许多实际应用场景中,我们可能会遇到训练数据和测试数据来自不同分布的情况,这被称为领域漂移(Domain Shift)。例如,在图像分类任务中,训练图像可能是在清晰天气下拍摄的,而测试图像是在有雾天气下拍摄的;或者训练数据是来自某一个特定的数据集(如MNIST手写数字数据集),而实际应用场景中的数据来自另一个具有不同统计特性的数据集。这种分布差异会导致模型在测试数据上性能下降。Domain Adv...

Read more

机器学习的分类


机器学习主要可以分为以下几类:

  1. 监督学习(Supervised Learning)

    • 定义:监督学习是指利用标记(label)好的训练数据来学习一个模型,模型的目标是尽可能准确地预测新数据的标签。训练数据集中的每个样本都包含输入特征和对应的目标标签。
    • 分类(Classification)
      • 二分类(Binary Classification):将数据分为两个类别。例如,在垃圾邮件检测中,邮件被分为“垃圾邮件”和“非垃圾邮件”两类;在疾病诊断中,患者被判断为“患病”或“未患病”。典型的算法包括逻辑回归(Logistic Regression)、支持向量机(Support Vector M...

Read more

MLOps-知识体系-全景图


  • ML 生命周期

以下是一个较为常见的MLOps(机器学习运维)知识体系全景图的大致介绍:

数据管理

  • 数据采集:从各种数据源(如传感器、数据库、文件系统、网络爬虫等)收集原始数据,确保数据的质量和完整性在这一环节有基本把控,例如去除明显错误或重复的数据记录。
  • 数据清洗与预处理:处理缺失值、异常值,进行数据标准化、归一化等操作,让数据符合后续机器学习模型训练的要求,像将图像数据统一尺寸等。
  • 数据标注(若需要):对于有监督学习任务,通过人工标注或者利用标注工具、众包平台等方式给数据添加合适的标签,比如给图像中的物体标注类别名称。
  • 数据版本控制:类似代码版本控制,跟踪数据的不同版本变化,便...

Read more