文章存档
文章中心
2020-05-07 21:13:52
K最近邻(k-Nearest Neighbor,KNN)分类算法,通过测量不同特征值之间的距离进行分类,其指导思想是“近朱者赤,近墨者黑”,如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常为不大于20的整数。
KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 如下图所示,要决定绿
2020-05-06 17:56:20
机器学习是一种能从数据中学习的计算机编程科学以及艺术,就像下面这句话说得一样。
机器学习是使计算机无需显式编程就能学习的研究领域。——阿瑟·塞缪尔,1959年
不过还有一个更好的定义:
“如果一个程序在使用既有的经验(E)执行某类任务(T)的过程中被认为是“具备学习能力的”,那么它一定需要展现出:利用现有的经验(E),不断改善其
2020-04-19 22:30:19
常用公式
若 a=(x1,y1),b=(x2,y2)
则 a.b = |a||b|cosθ = x1.x2 + y1.y2 其中 cosθ这向量a和向量b的夹角
向量 ,则
2020-04-19 17:26:17
线性代数 视频
https://v.qq.com/x/cover/m2yy9zdbadasop8/n1405swq0pa.html
2020-04-19 16:46:10
行列式的性质
https://haokan.baidu.com/v?vid=12793964309747656456&pd=bjh&fr=bjhauthor&type=video
Dt = D 转置后 数值不变
行列式标记为 |A| 或 det(a)
行列式的值是一个数字,表示向量所在空间的【元素】 大小。
2020-04-19 11:17:10
图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。
一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。这是研究灰度变换的最特殊的方法,称为图像的二值化(Binarization)。
1. 全局阈(yu)值:
Python-OpenCV中提
2020-04-18 17:17:10
loc是指location的意思,iloc中的i是指integer。二者都是行索引
这两者的区别如下:
loc:works on labels in the index.
iloc:works on the positions in the index (so it only takes integers).
也就是说loc是根据index来索引,比如下边的df定义了一个index,那么loc就根据这个i
2020-04-18 16:52:48
什么是Pandas?
Pandas的名称来自于面板数据(panel data)和Python数据分析(data analysis)。
Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构 和 数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一。
一个强大的分析和操作大型结构化数据集所需的工具集
2020-04-11 17:31:05
举例说明
一般使用 import math 或者 from scipy import stats
不建议使用 from math import * (如果存在相同名称的函数名,会被覆盖)
2020-04-11 16:56:23
插值:SciPy提供了常见的插值算法,可以通过一组离散数据生成符合一定规律的插值函数(连续函数)。这样就可以传入x,得到函数值。
插值是实现离散数据连续化的一种方式。 在scipy中的interpolate中可以实现,具体为:
func = scipy.interpolate.interp1d(离散数
2020-01-11 17:10:39
生成器,可迭代对象,迭代器之间究竟是什么关系?
用一幅图来概括:
1.可迭代对象
像list,tuple,set,dict,str等可以直接作用于for循环的对象,称为可迭代对象。可迭代对象实现了__iter__方法,用于返回迭代器。
demo = [1,2,3,4]
print(isinstance(demo, Iterable)) //True
iter_ob
2020-01-05 15:06:01
Mac系统下的环境变量:
a. /etc/profile
b. /etc/paths
c. ~/.bash_profile
d. ~/.bash_login
e. ~/.profile
f. ~/.bashrc
其中a和b是系统级别的,系统启动就会加载,其余是用户接别的。
c,d,e按照从前往后的顺序读取,如果c文件存在,则后面的几个文件就会被忽略不读了,以此类推。
~/.bash