机器学习简介

机器学习概括

机器学习模型有监督模型（单模型线性模型 kmeans 决策树神经网络支持向量机）无监督模型（聚类降维）概率模型（EM MCMC 贝叶斯）

机器学习分类

监督学习

分类回归

无监督学习

聚类降维

机器学习的方法和流程

模型机器学习首先考虑使用什么模型

模型分为概率模型和非概率模型

概率模型：决策树朴素贝叶斯

非概率模型：感知机支持向量机 Kmeans 神经网络

按判别函数的线性与否分为线性模型和非线性模型

线性模型：感知机线性支持向量机 Kmeans

非线性模型：核支持向量机神经网络

损失函数

模型预测出来的和真实的有差距用一个函数来计算这种差异

0-1损失函数

平方损失函数

这个对损失更敏感

绝对损失函数

优化算法

算法是指模型学习中具体计算方法解决问题的过程

基于参数模型构建的统计学习问题都是最优化问题

现有的优化方法主要有

梯度下降法

牛顿法

拟牛顿法

等等

模型评估指标

准确率

预测正确的样本占样本总数

开发流程

你在算法进行学习以得到模型这一步时，只需要提供 train.txt。train.txt 包含训练数据，用于训练模型。

test.txt 一般用于模型评估步骤。训练完成后，你可以使用 test.txt 来评估模型的性能，检查模型在未见过的数据上的表现。

总结：

训练模型：使用 train.txt
评估模型：使用 test.txt

逻辑回归

逻辑回归 logistic回归分析其实是对数几率回归一种广义的线性回归分析模型属于机器学习

其推导过程和计算方式类似回归的过程

实际上主要用于解决 二分类或者多分类问题 通过给定的n组数据训练模型在训练结束后对给定的一组或多组数据进行分类其中每组数据都是由p个指标构成

线性回归

最小二乘法点稍微多一点就不能用手算

算法思想是最后得到的是一根直线，就有k和b两个参数；要得到两个方程来解这两个参数

怎么来方程？

首先先得到一个等式。S（误差）=（（每个点到预测点的距离的差值）的平方）再求个和

我们显然是要S最小，利用数学上的导数。

右边的方程是两个参数，一个k一个b

我们分别对k求偏导

对b求偏导

还是利用数学知识，找最值问题。高中知识不能再多了函数单调增减性+导数正负与其的关系可以很容易知道要令偏导为0 然后干上去即可

分类问题

这是二分类下图

这是多分类下图

逻辑回归模型（对数几率回归

对数几率回归模型模型怎么用模型怎么得

1. 学习模型怎么用

对数几率回归模型用于二分类问题，通过以下步骤进行预测：

定义模型：对数几率回归模型的形式为： $σ (z) = \frac{1}{1 + e^{- z}}$ 其中， $z = β_{0} + β_{1} x_{1} + β_{2} x_{2} + \dots + β_{n} x_{n}$ 。
计算预测值：对于给定的输入特征 $x$ ，计算 $z$ 值： $z = β_{0} + β_{1} x_{1} + β_{2} x_{2} + \dots + β_{n} x_{n}$
映射到概率值：使用 sigmoid 函数将 $z$ 映射到 0 到 1 之间的概率值： $σ (z) = \frac{1}{1 + e^{- z}}$
分类判定：根据概率值进行分类：
- 如果概率值大于等于 0.5，则预测为正类（1）。
- 如果概率值小于 0.5，则预测为负类（0）。

2. 学习模型怎么得到

对数几率回归模型通过最大化似然函数来训练模型参数，具体步骤如下：

定义似然函数：对于给定的训练数据集，定义似然函数为： $L (β) = \prod_{i = 1}^{m} σ (z_{i})^{y_{i}} (1 - σ (z_{i}))^{1 - y_{i}}$ 其中， $m$ 是样本数量， $y_{i}$ 是第 $i$ 个样本的实际标签。
对数似然函数：为了简化计算，取对数似然函数： $ℓ (β) = \sum_{i = 1}^{m} [y_{i} \log (σ (z_{i})) + (1 - y_{i}) \log (1 - σ (z_{i}))]$
梯度下降：通过梯度下降法最大化对数似然函数，更新模型参数： $β_{j} := β_{j} + α \frac{\partial ℓ (β)}{\partial β_{j}}$ 其中， $α$ 是学习率， $\frac{\partial ℓ (β)}{\partial β_{j}}$ 是对数似然函数关于参数 $β_{j}$ 的偏导数。

解决多分类问题

对于多分类问题，可以使用以下两种方法：

一对多（One-vs-Rest, OvR）：将多分类问题转化为多个二分类问题。对于每个类别，训练一个二分类模型，将该类别作为正类，其他类别作为负类。最终的预测结果是所有模型中概率最大的类别。
多项逻辑回归（Softmax 回归）：直接扩展逻辑回归模型，使其能够处理多分类问题。模型形式为： $P (y = k ∣ x) = \frac{e^{z_{k}}}{\sum_{j = 1}^{K} e^{z_{j}}}$ 其中， $z_{k} = β_{k 0} + β_{k 1} x_{1} + β_{k 2} x_{2} + \dots + β_{k n} x_{n}$ ， $K$ 是类别数量。损失函数：使用交叉熵损失函数来训练模型参数： $J (β) = - \frac{1}{m} \sum_{i = 1}^{m} \sum_{k = 1}^{K} y_{i k} \log (P (y = k ∣ x_{i}))$ 其中， $y_{i k}$ 是第 $i$ 个样本属于第 $k$ 类的指示函数。