首页技术总结正文内容

分类

技术总结

更新时间：2024-12-23 08:36:14 35

admin 管理员组

文章数量: 887021

分类

逻辑回归的基本原理：逻辑回归预测的是概率，需要求解的是如何选取参数c和b可以使得所有样本预测正确的可能性最大。逻辑回归算法需要找到分类概率P(y=1)与输入向量X的直接关系，然后通过比较概率值来判断类别。

逻辑回归有个基本假设，即数据的分布符合伯努利分布，也就是正类的概率与负类的概率之和为1，如抛硬币，正反面概率之和为1.在样本具有若干属性值为X的前提下，样本被分类为正类（y=1）的概率为:

P(y=1|X)

而样本为负类的概率为：

P(y=0|X) = 1-P(y=1|X)

概率是指事件发生的可能性与不发生的可能性的比值。定义一个odd(x)为X的概率，这个概率的取值为0到正无穷，值越大，说明发生的可能性越大。odd(x)的表达式：

odd(x) = P(y=1|X)/P(y=0|X) = p/1-p

两边取自然对数就得到Logistic变换，将odd(x)的自然对数成为logit函数，

logit(p) = ln(odd(x)) = P(y=1|X)/P(y=0|X) = ln()--为线性回归所预测的假设函数:

假设函数：

p = 1/1+（z代表ln(odd(x)）p代表是y的概率）

逻辑回归的损失函数：

损失函数可以定义为负的最大似然函数，损失值越小，似然函数值就越大，这些模型参数也就越能导致样本的观测值。

J() = -ln(L()) = -(yln(h(x))+(1-y)ln(1-h(x)))

代码：

读取数据，划分数据集，处理数据

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_csv(r"D:\data\Social_Network_Ads.csv")
X = data.iloc[:,[2,3]]
y = data.iloc[:,4]
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test= train_test_split(X,y,test_size=0.25,random_state=42)
X_train.shape,X_test.shape,y_train.shape,y_test.shapefrom sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

训练模型，模型评估（混淆矩阵）：

from sklearn.linear_model import LogisticRegression
classifier = LogisticRegression(random_state = 0)
classifier.fit(X_train, y_train)
y_pred = classifier.predict(X_test)
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_pred)
cm

计算精确度与敏感度：

from sklearn.metrics import classification_report
report = classification_report(y_test, y_pred)
print(report)

二分类可视化结果：

plt.figure()
from matplotlib.colors import ListedColormap
X_set, y_set = X_train, y_train
X1, X2 = np.meshgrid(np.arange(start = X_set[:, 0].min() - 1, stop = X_set[:, 0].max() + 1, step = 0.01),np.arange(start = X_set[:, 1].min() - 1, stop = X_set[:, 1].max() + 1, step = 0.01))
plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(), X2.ravel()]).T).reshape(X1.shape),alpha = 0.75, cmap = ListedColormap(('pink', 'limegreen')))
plt.xlim(X1.min(), X1.max())
plt.ylim(X2.min(), X2.max())
for i, j in enumerate(np.unique(y_set)):plt.scatter(X_set[y_set == j, 0], X_set[y_set == j, 1],c = ListedColormap(('red', 'green'))(i), label = j)
plt.title('Logistic Regression (Training set)')
plt.xlabel('Age')
plt.ylabel('Estimated Salary')
plt.legend()
plt.show()

本文标签：分类

版权声明：本文标题：分类内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1687600812h119791.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

分类

分类

更多相关文章

淘宝店铺装修基础(最新详细图解)

帝国cms 调用当前栏目标题分类

高中英语写作高级词汇替换分类汇总

(C#)用户自定义控件-圆角Panel代码(WinForm)

怎么样查看WordPress的分类ID

把…分类的英文短语

Landsat TM 影像处理最完整流程

数组的分类与计算方法总结

Python编程语言中的自然语言处理与应用实践

制作垃圾分类小游戏--scratch中变量的应用

易语言物品分类系统源码

2013最新免费发布信息平台大全

大数据最常用的算法主要有哪些

Java+MySQL实现图书管理系统(完整代码)

python中的category函数

sklearn 朴素贝叶斯分类

python分类汇总代码

小学英语单词分类表(带音标)完整版

垃圾分类机器人的风险与对策

兰图绘用户手册

发表评论

推荐文章

解决windows installer服务不可用的途径

NO.23

php网页游戏学习之xnova(ogame)源码解读,PHP网页游戏学习之Xnova(ogame)源码解读（四）

结绳4.1.7

WSL2回收空间

热门文章

mac连接群晖的服务器会自动断开_白群晖和黑群晖对比那个好?老司机给你详细讲解...

与其锦上添花不如雪中送炭的意思

【熊子q的代码乐园】python写个健康报备记录小系统

日淘 kindle paperwhite2 简单评测

职业规划的简捷思路

2023最新SSM计算机毕业设计选题大全（附源码+LW）之java游乐园售票系统gl9jr

(已解决)VMware Workstation Pro安装CentOS7桥接解决上网问题：Network is unreachable

linux使用cifs方式mount（挂载）Windows7共享文件

安装飞利浦系统服务器,DOS系统安装Windows全攻略

在windows笔记本电脑部署GLM4大模型

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

（Windows系统）详细介绍Windows系统含有英文版