呓语 | 杨英明的个人博客

专注于c++、Python,欢迎交流

By

【IJCAI-17 口碑商家客流量预测】使用Pandas计算商家平均客流量

这段时间参加了天池的 IJCAI-17 口碑商家客流量预测 大数据竞赛,初次参加此类竞赛,也是第一次使用pandas,折腾了许久,记录下自己的心得。代码很粗糙,仅作个人记录用。参考价值不大,大神勿喷。

下面出现的代码已经提交检验通过,第一次提交混上了排行榜,400+左右的位置,第二次修改了一下混到了200+的位置,真是没有想到这么水的算法也能上排行榜……

By

Pandas读取csv表格数据 && 存入数据库

作为一只萌新报名参加了阿里的天池大数据比赛,参加的这场比赛的题目是 预测商家未来14天的客流量 。由于第一次做ML/DM方面的比赛,所以上手需要学习不少新知识,比如读取数据这方面。

Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的,经常用于数据分析和科学计算领域。

不管参加天池大数据比赛或者是Kaggle,首先要做得都是从比赛提供的数据文件中将数据提取出来,即 提取数据

为了更好的提取数据我不可避免的用到了Pandas,在这里我把用pandas提取csv表格数据的心得记录下来。

By

Django网站搭建心得汇总

搭建该网站过程中的心得汇总。

By

博客园文章迁移脚本(xml.sax+mysqldb)

写博客系统的后期需要把之前的文章导入过来,我之前的文章都在博客园上,但是博客园只提供博文导入到有限的第三方博客系统中,这里面肯定不包括我自己写的博客系统,所以我需要自己写一个文章迁移程序。

好在博客园提供博文备份功能,导出的备份文件是 xml格式

所以文章迁移程序要完成两个步骤:

  1. 解析xml文件
  2. 执行sql导入文章

By

Django-markdownx 修改预览页默认CSS样式

在使用django-markdownx的过程中,存在不少问题,比如说这次要讨论的问题:预览页面显示样式和文章发布出去的显示样式不同。

导致这个问题的原因很简单:因为 后台使用的css和前台使用的css不同

在这里我只打算修改后台markdownx预览页的显示样式,让它显示效果和前台的显示效果相同。

By

Django 后台添加more标签识别(自动截取文章简介)

文章发布时,后台有 文章内容文章描述 两个栏目需要填写,文章描述 其实就是文章简介/摘录,用于显示在首页文章列表中。

一开始我在填写这两个栏目时候的做法是,先写文章,然后从文章内容中截取一部分放到文章描述中,另一种做法就是直接将文章标题当做文章描述。

这样很麻烦,于是我想做一个“识别more标签”的功能,即在后台编辑文章时,在合适的地方插入 --more--,点击发布的时候后台会自动将more标签之前的内容截取出来作为文章描述。

By

Django-markdownx 修改默认渲染引擎,支持GFM的```代码块识别

Django-markdownx 是一款django的插件,它用于markdown文档的编写,简单来说,它是一款网页端的markdown编辑器。

Markdownx用起来虽然不错,但是他在一些方面还是有些限制,比如说我想让他支持```代码块识别

By

Django-markdownx 支持gif动态图片上传

Django-markdownx 是一款轻量级的Markdown编辑器,可作为app在django中使用。

我将它安装在了admin后台,用于写文章。

下图是它的使用预览:

By

Django admin 自定义Choice_field

Django admin 自定义Choice_field

By

KindEditor 4.15无法修改默认显示字体大小

KindEditor 4.15无法修改默认显示字体大小

By

黑板客爬虫闯关 代码

黑板客爬虫闯关 代码

By

新浪云SAE搭建python环境 问题拾遗

新浪云SAE搭建python环境 问题拾遗

By

Python 学习拾遗

该博文主要适应于python2.7,并没有对py3进行测试。

主要记录学习python过程中容易出现的一些小问题、小错误,相信能给你启发。

By

关于python中的字符串编码理解

关于python中的字符串编码理解

By

python中list作为全局变量无需global声明的原因

python中list作为全局变量无需global声明的原因

By

批量下载小说网站上的小说(python爬虫)

批量下载小说网站上的小说(python爬虫)

By

关于python中的字符串编码理解

python2.x 中中间编码为unicode,一个字符串需要decode为unicode,再enc

By

使用pyInstaller发布PathMerge的exe版本(py转换成exe)

使用pyInstaller发布PathMerge的exe版本(py转换成exe)

By

python开发目录合并小工具 PathMerge

python开发目录合并小工具 PathMerge

By

python计算文件的md5值

python计算文件的md5值