08领域技术三月 1, 2019项目_kaggleTitanic练手作Titanic数据概览图1图2图3各字段含义:PassengerId=>乘客IDPclass=>乘客等级(1/2/3等舱位)Name=>乘客姓名Sex=>性别Age=>年龄SibSp=>堂兄弟/妹个数Parch=>父母与小孩个数Ticket=>船票信息Fare=>票价Cabin=>客舱Emba项目
08领域技术三月 1, 2019算法_机器学习十大算法优缺点机器学习十大算法数据挖掘十大算法总结—核心思想,算法优缺点,应用领域,数据挖掘优缺点分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM聚类算法:KMeans统计学习:EM关联分析:Apriori链接挖掘:PageRank其中,EM算法虽可以用来聚类,但是由于EM算法算法
08领域技术三月 1, 2019项目_天池津南数字制造标题【赛场一】地址:https://tianchi.aliyun.com/competition/entrance/231695/information特征01_特征观察INFO:__main__:columns_info:typecountcount_rateunique_countunique_项目
08领域技术三月 1, 2019项目_kaggle房价预测01ipynb转化(对应notebook文件(图片路径需要重新生成)/kaggle_housePrice/house_price01.ipynb)%runMyTools.pyimportreasrefromsklearn.grid_searchimportGridSearchCVfromsklearn.项目
08领域技术三月 1, 2019项目_天池工业蒸汽量预测特征工程01_columns_infoprint(columns_info)typecountcount_rateunique_countunique_setmeanstdmin25%50%75%maxtargetfloat28881.0001916[(0.669,7),(0.817000000000000项目
08领域技术三月 1, 2019项目_天池移动推荐问题问题描述官方介绍URL:https://tianchi.aliyun.com/competition/information.htm?raceId=1简单来说:根据用户30天(T-29到T日)和产品交互信息(浏览收藏加购购买)判断T+1日购买情况。乍一看,有点蒙,预测问题至少给出需要预测的数据吧项目
08领域技术三月 1, 2019预处理_pandas数据预处理数据预处理常用python方法01从数据中读取数据importpandasaspdimportMySQLdbmysql_cn=MySQLdb.connect(host='localhost',port=3306,user='myusername',passwd='mypassword',db='my预处理
08领域技术三月 1, 2019项目_天池电力预测题目:[智造扬中]大航杯电力AI大赛地址:https://tianchi.aliyun.com/competition/entrance/231602/information这个项目做了一半就放弃了,主要是数据偏大,本机使用单sql+聚集函数都需10分钟以上.使用阿里云环境,也有问题,一方面由于sq项目
08领域技术三月 1, 2019统计_PValue个人理解最近见到p-value的频率有点高,之前也看到很多次了,基本当时懂了过几天就忘记了,整理下。P值定义[from:百度百科]P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P值,一般以P<0.05为有统计学差异,P<0.01为有显著统计学差异,P<统计
08领域技术三月 1, 2019项目_天池工业蒸汽量预测特征工程1,特征和目标的相关性观察参考:feature/01_columns_info.txt,02_column_corr.txt,03_all_data_corr.txt2,特征处理批次第一批,处理方式,异常值收边,分区转换V00.8732120.8667090.589606V10.871846项目
07通用技术二月 8, 2019python实战04_常见坑何谓坑:凡是和大多数人的直观理解不一致的,都可称之为“坑”一部分在其他博文中提到过,不再重复比如:默认参数最好不为可变对象时有时无的切片异常不执行的delreturn不一定都是函数的终点博文,中提过,所以不再重复博文:python阅读wtfbook疑问和验证,也记录了一些坑,也不再重复本文作为对以上python实战
07通用技术二月 2, 2019vnpy_ubuntu18下vnpy的安装vnpy1.9版本主要参考:https://github.com/vnpy/vnpy/wiki/Ubuntu%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85s1,创建conda环境condacreate-nvnpy27python=2.7sourceactivatevnpy2vnpy
07通用技术一月 14, 2019软件_印象笔记无法同步EDAMSystemException可能国内软件做的太人性化了,最近用的几个国外软件,真的各种反人性,尤其是今天的evernote,窝火!1,网页web版,新版旧版并存,新版切换旧版,链接明显。旧版切新版,找不到入口!!请问,是在鼓励用户使用旧版么?那做新版干干嘛呢?用户一旦误点击,切换到旧版,发现,回不到新版了!!!!2,同步问题,软件
07通用技术一月 4, 2019python实战02_异常报错百度自然语言处理报错:UnicodeEncodeError:‘gbk’codeccan’tencodecharacter‘\U0001f602’inposit原因:ubuntu机器编码utf8,接口尝试用gbk解析,在对str转换格式时报错解决:比如title变量.str(title.encode(python实战
07通用技术一月 2, 2019软件_win10安装rqalphawin10安装rqalpha参考文档rqalpha地址:https://rqalpha.readthedocs.io/zh_CN/latest/intro/detail_install.html#intro-detail-install1,安装ubuntu和win10共存的双系统,失败,放弃2,使用软件