如何在站点静态文件下查找某关键字并修改文件名?

分类:Python,Shell,工作记,问题集 | 作者:凹凸曼 | 发表于2014/11/18 1条评论

前段时间,因关于某些政治性的内容,公司部分站点需要做处理,而且数据库只保存近几年的,无法通过数据库删除或修改早些年的静态页面数据

站点文件个数,不会少于几百万,我想大家不会一个个手工查找吧!也许真的有人那样搞呢,我只能“呵呵”了

用程序思想去解决工作中遇到的问题,很有必要!

站点环境:linux

可以使用的shell脚本处理,因为他们是天生在一起的,而且处理上很方便,不过一开始有一个问题木有考虑到,后面再讲

上代码,shell代码如下:

python开发《小猫抓》分析工具

分类:PHP,Python,工作记 | 作者:凹凸曼 | 发表于2014/05/19

mongodb(nosql)有一段时间木有用,正好最近写一个东东,使用php+python+mongodb(nosql)实战一下
定义工具(项目)名字:小猫抓

需求: 1、 获取子站点每天在百度最新收录新闻、收录总数 2、 获取百度权重、google pr

基本思路:客户端 php 做查询 、服务器端python 做分析并录入数据库、 数据库nosql-mongodb。

运行环境:http服务+php5.3+mongo-1.5.0+mongodb-linux-x86_64-2.6.0+python2.6.6+pymongo-2.7

客户端效果图:

Python代码性能优化技巧

分类:Python | 作者:凹凸曼 | 发表于2012/07/23

代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构、优化、扩展以及文档相关的事情通常需要消耗 80% 的工作量。优化通常包含两方面的内容:减小代码的体积,提高代码的运行效率。

改进算法,选择合适的数据结构

一个良好的算法能够对性能起到关键作用,因此性能改进的首要点是对算法的改进。在算法的时间复杂度排序上依次是:

O(1) -> O(lg n) -> O(n lg n) -> O(n^2) -> O(n^3) -> O(n^k) -> O(k^n) -> O(n!)

因此如果能够在时间复杂度上对算法进行一定的改进,对性能的提高不言而喻。但对具体算法的改进不属于本文讨论的范围,读者可以自行参考这方面资料。下面的内容将集中讨论数据结构的选择。

字典 (dictionary) 与列表 (list)

怎样解决抓包pcap无法加载?

分类:Python,问题集 | 作者:凹凸曼 | 发表于2011/06/13

环境:winXP+python2.5

pcap下载:http://code.google.com/p/pypcap/downloads/list

接着测试了一下安装的模块,居然报如下错误:

———- python2.5 ———-
Traceback (most recent call last):
File “grupdata.py”, line 2, in

Python写的电话薄部分源码

分类:Python | 作者:凹凸曼 | 发表于2011/05/24

下面把之前用python写的C/S模式的电话薄程序 USER类,把它晒出来!

其中导入了操作文件类–Bfile

可以看之前的晒过的,源码:

Python怎样打包成exe?

分类:Python | 作者:凹凸曼 | 发表于2011/03/01

发现PyInstaller 是个不错的东东,解决打包单个exe的问题,使用非常简单,不用编写setup脚本: 进入开发目录,执行命令行(可以做个bat文件): 引用 python d:\pyinstaller-1.3\configure.py python d:\pyinstaller-1.3\Makespec.py client.py –onefile –windowed –icon=client.ico python d:\pyinstaller-1.3\build.py client.spec 就这样一个单独的client.exe就产生了,不到3M,是压缩前的三分之一,如果用wxpython大概会有6M多,py2exe压缩的单个exe也差不多这个大小,但py2exe并没有把所有的dll打包。pyinstaller打包比较彻底,就只有一个exe文件。 生成完后同时有个警告文件,内容是

Python 如何操作文件?

分类:Python | 作者:凹凸曼 | 发表于2011/03/01 1条评论

Python 如何操作文件?
分类:Python | 作者:凹凸曼 | 发表于2011/03/01 没有评论 编辑
#文件操作(类) #coding=gbk #author : 凹凸曼( lyc) #email : jar-c@163.com #time : 2010-9-30 try : import pickle import os except: print(‘相关模块未引入!’) class Bfile : path=’contacts.data’ #存放文件的路径 # 打开文件 # @param rw string # return bool def openf(self,rw): try : if os.path.isfile(Bfile.path)==False: f=open(Bfile.path,’w’) f=open(Bfile.path,rw) return f except: […]

Python2.x与 Python3.0的区别

分类:Python | 作者:凹凸曼 | 发表于2011/03/01 1条评论

由javaeye的姜太公翻译 原文:What’s New in Python 3.0 这篇文章主要介绍了相比于python2.6,python3.0的新特性。更详细的介绍请参见python3.0的文档。 Common Stumbling Blocks 本段简单的列出容易使人出错的变动。 * print语句被print()函数取代了,可以使用关键字参数来替代老的print特殊语法。例如: 1. Old: print “The answer is”, 2*2 2. New: print(”The answer is”, 2*2) 3. Old: print x, # 使用逗号结尾禁止换行 […]