Archive for 算法-编程

django forms的模板自定义实现

WEB Django | 2012-02-13 00:28:04 | 1 COMMENT

django提供的forms可以很方便的实现创建表单，表单内容的过滤，提交。但是表单模板返回的固定代码。开始学习的翻译文档，forms自定义表单模板的成分很少，特别是errors的介绍。查资料没找到。又看官网，找到了（还是官网好哇~）。复制代码上来，做分享。 <div> <label for="id_username">用户名：</label> <div> {{ form.username }} {% if form.username.errors %} <span> {% for error in form.username.errors %} {{ error|escape }} {% endfor %} </span> {% else %} <p>用户名中只能包含字母、数字、下划线和汉字。<p> {% endif %} </div> </div>

C学习笔记1

编程 C语言 | 2012-01-26 19:30:53 | 0 COMMENT

#include  
/* 用于将输入复制到输出的程序；第2个版本 */
main ( )
{
int  c;
while ( (c = getchar ( ) ) != EOF )
putchar ( c );
}

g e t c h a r函数在没有输入时返回一个特殊值，这个特殊值不能与任何实际字符相混淆。这个值叫做E O F（End Of File，文件结束）。必须把c说明成一个大到足以存放g e t c h a r函数可能返回的各种值的类型。之所以不把c说明成c h a r类型，是因为c必须大到除了能存储任何可能的字符外还要能存储文件结束符E O F。因此，把c说明成i n t类型的。 VC6.0打印输出EOF值发现是-1

漫谈C语言及如何学习C语言 sunxiunan.com

编程 C语言 | 2012-01-26 15:10:44 | 0 COMMENT

云风最近写了一篇博客《C语言的前世今生》。作为长期使用C语言开发网络游戏服务器的程序员，云风是有理由写这样一篇文字，不过还是感觉谈的不够深入，C语言在业界使用的现状没有怎么描写，有些意犹未尽。在这里想比较系统的谈谈个人对C语言学习方式方法的理解。分别按照书籍、实验环境搭建、网络资源来分别介绍，希望能写的比较完整全面一些，给想学习C语言的朋友一个有价值的参考。为什么要学习C语言？为什么要学习、使用C语言？为什么要学习一个可能比自己都岁数大的编程语言？我在前面如何学习编程语言的博客文章http://sunxiunan.com/?p=1597 里提到，选择一门编程语言，“为什么而学”这个目的是最重要的，目的不明确就没法学好。这也是为什么很多学生朋友在大学里必修C语言却觉得没学明白的原因。因为学习的目的不明确，学习当然也没有动力。还有一个原因是C语言是工程实践性很强的语言，它不是来自某个研究所某个大学学院，而是实实在在从项目需要中产生，伴随着Unix的兴起而流行，语义简明清晰，功能强大而不臃肿，简洁而又不过分简单，实在是居家旅行工作学习必备之良友。 C语言相比C++的优点之一就是最小惊讶原则，一是一二是二，不会在私底下产生一些莫名其妙的额外产物。用C++做个例子，比如这样一个函数原型void PassWithClassValue(COneClass clsParam1)，稍微了解C++的朋友都会知道，如果你没有实现COneClass的拷贝构造函数，编译器会好心的帮你实现一个，而且在调用这个函数PassWithClassValue的时候，偷偷地调用拷贝构造函数产生一个临时对象作为参数传递，对于某些情况，比如编写操作系统这类必须优化性能的情景下，这些自以为是的东西是非常邪恶的事情。 C语言本身只提供必要的语言特性，其它复杂一点功能如文件处理、数学计算等等都以库函数方式提供，甚至连malloc、free这种“必须有”的功能，也是以标准库函数的方式提供，而不是作为C语言核心出现。在伟大的著名的无所不包的《K&R》开头部分就提到了，for其实可以通过while来完成，只不过for可以写的更简洁，言外之意，对于C语言for其实不是必要的。跑题一点说，在其它程序语言中Lua可以说继承了C语言简洁的设计哲学，甚至连continue这种几乎必备的关键字都一直拒绝加入，在Lua的maillist以及wiki里都提到过continue这个问题，Lua语言维护者认为continue对于Lua而言不是必要的，也不考虑在后续版本中添加这个关键字。这种简洁哲学也让C语言的可移植性、便携性特别优秀，也使得很多嵌入式系统依然使用C语言作为主要编程工作语言。 Java语言有一个口号：“一次编写，处处运行”，就是跨平台这个噱头。实际上C语言从早期开始就几乎达到了“一次编写，处处编译”，在ANSI在1989年统一了C语言标准以后（称之为C89），只要特定平台上的编译器完整实现了C89标准，而且你的代码没有使用某些特殊的扩展（GCC以及微软都有自己的编译器特定扩展），那么代码一定可以编译通过，再实现一下操作系统相关的函数库，C语言的移植就是很简单的事情。可以用Lua作为例子，Lua本身是完全遵循C89标准，没有使用任何特定扩展，这也保证了有C语言编译器的平台，都可以编译使用Lua。可以编译运行C语言的硬件平台可以从A排到Z，真是非常有意思的事情。 C语言也是一个比较少见的应用领域极为广泛的语言。比如编写操作系统这种高难问题，只有C++、汇编语言可以做到。C语言可以编写服务器端软件如Apache、Nginx，或者编写GUI程序，如GTK。大多数程序语言的第一版是通过C语言实现，借助前面提到的“一次编写处处编译”，最大的保证了这些程序语言的可移植性。在Web开发领域，C语言的应用相对较少，这也是一种取舍的结果，Web开发需要使用PHP、Ruby、Python这样的动态语言，可以快速上线快速修改，可以最大程度满足用户时时变化的需求，这也是C语言的弱项。如果把程序语言的应用领域从硬件到管理软件、Web程序做一个很粗略从下到上的排列，C语言适合领域是比较底层靠近硬件的部分，而新兴语言比较偏重于高层管理或者Web开发这种相对贴近最终用户的领域。比较流行的混合开发模式是使用C语言编写底层高性能部分代码或后台服务器代码，而使用动态语言如Python做前端开发，充分发挥它们各自的优势力量。提到C语言的缺点，常常是它缺少这种或者那种特性，比如有人建议加入GC，有人建议加入并行或者并发支持，有人提到没有一个比较完整的类似C++的异常策略。这些特性有的可以通过引入第三方库来实现，但C语言的设计哲学其实决定了它不会像C++那样“非常强大”。即使引入了某些人期望的特性，依然会是某些人喜欢某些人不喜欢的情形，现在的功能对于C语言应用领域来说已经够用，其它特性可以通过特定程序语言实现，并且通过C API与C语言编写的程序进行交互。任何一个工匠都不可能只使用一个工具完成他的工作，不同工具结合起来才能更快更好的完成任务。提到C API，也稍微介绍一下，我们知道windows操作系统的api也好，Linux的系统api也好，或者是想给Ruby、Python编写扩展模块，C语言形式的函数定义都是唯一的选择。C语言就好像是一个中间层或者是胶水，如果想把不同编程语言实现的功能模块混合使用，C语言是最佳的选择。提了这么多关于C语言的好处，那么学习C语言是否适合就看你自己的判断了，例如要进行一个嵌入式项目，或者需要进行服务器端开发，或者写一个性能相关的组件等等，C语言都是比较好用的选择。另外也可以在C++的使用过程中有意的使用C语言的思考方式，汲取C语言简洁明快清晰地设计思路，对编程设计水平会有很大的提高。 C语言学习方法在前面http://sunxiunan.com/?p=1597 曾经提到过一个比较系统学习一门新的编程语言的方式，C语言学习也可以按照类似的顺序：阅读参考书，阅读代码，编写调试实际程序，上网参与讨论，研究高级话题。学习语言的开始一般是阅读参考书。我建议选择几本非常经典的好书，仔细完整反复阅读几遍，“书读百遍其义自现”。选择C语言学习的好处是，这几本书基本上完整涵盖了C语言编程领域的方方面面，不会像C++那样，即使读完一堆书还是有些糊涂，依然有这样那样难懂的陷阱。 1，参考书籍在豆瓣上列了一个书单，大家可以直接参考http://book.douban.com/doulist/636329/ 在下面简单点评一下，阅读顺序最好参照列出的顺序。《The C Programming Language》http://book.douban.com/subject/1230004/ 如果你只想买一本书学习C语言，只需要买这一本就够了。如果你经费足够，建议你多买几本，办公室、家里都放上一本，随手都可以翻翻。用三个词语来形容它就是：经典！经典！经典！这本薄薄的只有二百多页的小书涵盖了C语言的方方面面，前无古人而且后无来者，任何溢美之词都不足以形容它。《The C Programming Language》（后面称为 K&R）里面包含了一个简单的语法解析器，包含了malloc如何实现，包含了一个完整的操作系统目录浏览程序，这些程序的实用性极高，可以这样说，如果学习任何一门语言能够自己独立动手实现以上的功能，基本上就可以算是入门了。K&R书里面每段都蕴含着非常值得探究的软件开发工程实践经验，如果没有一定的开发经验，其实是看不出来这些冰山下面的内容的，比如开头一章就提出用写完整代码这种方式来教学，而在书中那些C语言的陷阱或者可能出问题的地方，都有提到，但是由于篇幅所限，写的非常简约，很难让人一下就看懂。我正在完整的逐字逐句的阅读此书，希望能稍作注解，写几篇博客分享一下。《C程序设计语言（第2版·新版）》http://book.douban.com/subject/1139336/ 这是K&R的中文译本，可以先从中文译本看起，然后再读一遍英文原版，既可以学习英文，又可以体会原文那种简约优美的风格。《C陷阱与缺陷》http://book.douban.com/subject/2778632/ 《C专家编程》http://book.douban.com/subject/2377310/ 这两本书也是学习及使用C语言的朋友必备的两本书，比如《C专家编程》，专门用两三个章节详细介绍C语言中数组与指针的不同之处，这两本书在某种程度上算是对K&R略过的地方做了详细补充，强烈推荐。《C语言参考手册》http://book.douban.com/subject/2132084/ 这是最后一本强烈推荐你最好买回家作为案头书必备的参考书。前面几本书或者稍显简略，或者专注某个特定专题，都不适合遇到问题时翻查。这本《C语言参考手册》可以看作是C语言编程的《新华字典》，全面而权威。里面还涵盖了C99的内容，紧跟时代潮流。下面几本书都可以作为交叉参考，也都很有价值，也是建议大家都买下来，好书如朋友，日久弥新，像是我推荐的这几本书在douban或者amazon上评分都非常高，而且反复再版。《C和指针》http://book.douban.com/subject/1229973/ 指针的重要性如何，学过C语言（或者C++）的朋友都知道，这本书更是把指针拔高到了与C语言平起平坐的地位，其实也是从头开始介绍，作为教学参考书也是可以的。《C标准库》http://book.douban.com/subject/3775842/ 这本书是专门介绍C语言的标准库如何实现的，比如malloc算法，用标准的C语言该如何写？strlen这个函数应该如何实现？尽管书中不少代码与真实的C标准库相差很多（由于标准库需要考虑性能优化，很多函数有一些特定的trick），但是绝对值得参考。《你必须知道的495个C语言问题》 http://book.douban.com/subject/3422332/ 这本书其实就是C-FAQ的印刷版本，C-FAQ在各种编程语言的FAQ中可以称得上质量一流。如果你想应聘或者招聘C语言相关程序员，这本书一定要参考。《Linux C编程一站式学习》http://book.douban.com/subject/4141733/ 这本书是基于特定操作系统Linux来介绍C语言编程，可作为计算机相关专业的教科书或入门参考书，也是书单里面唯一一本国人原创的编程书籍，非常难得。书中几乎所有内容都在网上直接公开，针对读者的意见进行修改，这也是非常难得的一种开放态度。非常推荐大家买一本。学习C语言，一定不能只读书，应该动手练习完成书里面的项目需求（比如编写一个目录浏览器）以及每章的练习题目。这就需要有可以实验的环境，下面针对不同操作系统简单做一下介绍。 2，动手实验环境搭建也没有调查过，不知道现在学校里学习C语言是不是依然跟着谭浩强老师用TurboC2.0编程，如果还是这个组合的话，那就太差劲了，赶快抛开它们。下面主要介绍不同操作系统平台下的集成编程环境，基于初学者以及我个人喜好，就不推荐大家命令行下用vim编程了，直接上IDE。 Windows系统下推荐大家使用Code::blocks这个软件。这个软件最大优点是自带了基于mingw的GCC以及GDB，只要下载70M左右软件包，就可以完整支持C++、C语言编程了。各种功能（比如调试功能）也很强大，版本更新也比较快。注意下载选择名字有mingw的文件，比如最新版本是codeblocks-10.05mingw-setup.exe（版本也许有所不同）。主页：http://www.codeblocks.org/ 如果需要做Windows操作系统的开发，可以下载Visual C++ 2010 Express。因为Code::Blocks不包含Windows编程头文件（实际是因为没有Windows SDK），无法编写Windows操作系统相关的界面应用程序或者服务类程序。而VC++Express自带了这些头文件以及编程库，虽然功能稍微简陋，但对于练习使用基本够用。主页：http://www.microsoft.com/express/windows/ 对于计算机专业的学生朋友，建议大家使用Linux操作系统，或者更详细一点是使用Xubuntu操作系统作为桌面，使用Netbeans和GCC这个组合（当然也可以选择Code::Blocks）。在Xubuntu下可以通过apt-get install build-essential这个命令安装gcc相关程序，已经可以在Terminal下编译C语言程序了，但为了使用方便，大家可以选择Netbeans的C++支持包，在Netbeans网站上就能下载。主页：http://netbeans.org/features/cpp/index.html 如果使用苹果Mac系统，毫无疑问XCode就是编程的绝佳选择，XCode可以在苹果开发者网站上免费下载，在IPhone SDK中也包含了XCode。主页：http://developer.apple.com/technologies/tools/xcode.html 如果手头没有合适的编程环境，还需要实验一些简单的代码，可以用http://codepad.org/ 提供的服务，在线编写运行代码。另外建议大家申请一个github.com的账号，在gist.github.com可以保存自己的练习代码，就不需要随身带着U盘了。 3，网络资源如果想用十分钟时间了解一下C语言的来龙去脉、前世今生，维基百科这个页面http://en.wikipedia.org/wiki/C_%28programming_language%29 是最佳选择。从维基百科可以看到，C语言1972年由Dennis Ritchie设计的命令式、结构化范式编程语言。类型为静态的弱类型，需要显式定义。最新国际标准为C99。设计上主要受到了B、ALGOL68、汇编语言、PL/I、FORTRAN的影响，C语言也影响了大量编程语言，如C++、Objective-C、C#、Java、Go、PHP、Python等等（个人觉得受C影响很大的是PHP，基本上有C编程基础的程序员，很容易就能上手PHP了，除了PHP的OO部分）。在维基百科条目中有很大篇幅介绍了作者认为C语言缺失的特性，比如面向对象、多线程、GC、异常处理等等，当然这有些吹毛求疵，如果需要这些特性，完全可以用其它程序语言。另外一个介绍的重点是“未定义行为”，有些我们认为理所当然的结果，其实在C语言标准中并没有明确定义，假定这些行为应该如何，当程序使用另外的编译器或者不同版本编译器编译运行，都可能有bug产生。接下来维基百科条目谈到了C语言的用处，必须承认尽管现在编程语言成百上千，能称之为“系统级”的少之又少，新兴语言中只有Go还能称得上。现在大规模软件项目中完全选用C语言可能性不大，但是核心部分完全可以用C搭建，相对C++开发工具的高昂价格，C语言相关的免费辅助开发软件非常丰富，比如splint，valgrind，不少核心库经过长期使用也都非常稳定。由于C语言广泛支持各种平台以及编译器相对成熟可靠，不少编程语言选择C语言作为一个中间层，比如Glasgow Haskell编译器就是这样做的。另一个可以找到大量C语言编程相关资料的地方是“美味书签”，通过搜索特定关键字（C + programming）就可以找到很多值得挖掘的资源http://delicious.com/search?p=c+programming 还可以参考dmoz.org的C语言分类http://www.dmoz.org/Computers/Programming/Languages/C/ 相比美味书签时效性能差点，但是分类比较系统，查找也要容易一些。程序员往往是懒惰的，“拿来主义”、“拷贝主义”很流行也很有效，当对某个函数或者关键字不是很理解的时候，看看别人是怎么使用的，会非常有启发性。这里介绍几个常用的代码搜索网站，最常用的是google的codesearch：http://codesearch.google.com ，可以通过不同条件及正则表达式搜索特定关键词。另外可以参考维基百科上一个“带有C语言示例的文章”分类，里面代码写的也很不错。还可以在github.com上搜索相关项目。在前面博客文章我还介绍了一个名为罗塞塔代码的网站http://rosettacode.org/ 这个网站上可以找到不同程序语言针对某个问题的解决方案，用于学习比较非常便利。学习编程也需要大量阅读名家经典代码，与学中文英文需要大量阅读名著一个道理，C语言编程优质项目那是“彩旗飘舞，人山人海”，个人建议可以看看Lua、Sqlite、Nginx这些项目的代码，代码量不多，而且代码质量也都比较高。另外可以看看Linux内核代码，坊间有不少书籍可以帮助解读。关于如何很好的阅读代码，大家可以参考《Code Reading》这本书。书看了几本，代码写了一些，也略微读了读其他人的代码，就应该用C语言来完成真实工作中碰到的问题，让C语言真正成为你的瑞士军刀。只有当你经常使用C语言来进行编程工作，经常思考如何通过C设计一个优雅高效的系统，才能更深刻的理解C语言设计哲学。还可以到http://stackoverflow.com 参与回答问题，浏览其他人的问题解答来汲取知识，比如这篇http://stackoverflow.com/questions/2054939/char-is-signed-or-unsigned-by-default 就介绍了一个C语言关于char类型的小陷阱。 C语言学习当中，有一些难点需要多加注意，如pointer与array的不同之处，复杂类型定义如何解读，如何正确使用预处理preprocessor以及宏定义。其实这些内容在前面书籍都是反复提到，如果按部就班学习下来，应该不成问题。当C语言学习的差不多时候，还可以学习一门动态语言，比如Lua或者Python，试着在实际工作项目中混合使用动态语言与C语言，一加一发挥出来的力量不仅仅是二，而是非常二（说笑一下，哈哈）。还有什么问题，欢迎留言。附录一些有用的C语言网络资源： C语言标准化组织ISO JTC1/SC22/WG14的主页，在这里可以找到ISO C的文档：http://www.open-std.org/jtc1/sc22/wg14/ 《The Development of the C Language》作者Dennis Ritchie，极为经典的论文。 http://cm.bell-labs.com/cm/cs/who/dmr/chist.html “C语言全景”这个网站内容很全面：http://www.softpanorama.org/Lang/c.shtml Dan Saks在embedded.com上的专栏Programming Pointer ，里面文章很有深度，值得一读。 http://www.lysator.liu.se/c/c-www.html 这也是一个C语言资源汇总页面。 http://www.ioccc.org/index.html 混乱C语言代码大赛，很著名。 http://en.wikipedia.org/wiki/Underhanded_C_Contest 另外一个C语言编程大赛，主要面向黑客。 comp.lang.c以及c.moderated这两个讨论组推荐订阅，相当于互联网最大的C相关编程问题论坛： http://groups.google.com/group/comp.lang.c http://groups.google.com/group/comp.lang.c.moderated 这里对C语言的各种bit操作做了收集整理，不少题目在面试时候经常出现。http://graphics.stanford.edu/~seander/bithacks.html 台湾的惯C达人Jserv博客，建议大家订阅：http://blog.linux.org.tw/~jserv/ 一些值得关注及研究的C语言相关项目： TinyCC，被很多项目用作动态编译C语言的编译器引擎：http://bellard.org/tcc/ GCC的标准库实现：http://en.wikipedia.org/wiki/GNU_C_Library Glib是GTK的底层辅助编程库，与C标准库是不一样的，在C语言上实现了面向对象机制：http://en.wikipedia.org/wiki/GLib dietlibc在前面博客文章介绍过，C标准库的另一种实现：http://www.fefe.de/dietlibc/ 一些C语言编程时可以使用的工具软件，帮你提高代码质量： http://www.splint.org/ http://valgrind.org/ http://www.dwheeler.com/flawfinder/ PMD可用于检测重复代码 http://pmd.sourceforge.net/cpd.html llvm的静态分析项目 http://clang-analyzer.llvm.org/ C语言编程规范编程标准： http://en.wikipedia.org/wiki/MISRA_C http://www.eecs.harvard.edu/~ellard/CS50-96/programming-style.html http://developers.sun.com/solaris/articles/secure.html cert这个文档国内有中文翻译版本：https://www.securecoding.cert.org/confluence/display/seccode/CERT+C+Secure+Coding+Standard http://www.cs.utah.edu/dept/old/texinfo/standards/standards_toc.html C语言编程电子书及教程： http://publications.gbdirect.co.uk/c_book/ 这一本写的非常详细，你可以把它看成是类似谭浩强版的教科书。 http://www.knosof.co.uk/cbook/cbook.html 这一本云风曾经推荐过，相当深入的介绍了C99标准，深入细节时候需要读读。 http://www.duckware.com/bugfreec/index.html 这本书在网上流传一个中文版本，《编写优化、高效、无错地代码》，另外也有英文影印版《编程精粹》。 http://wangcong.org/blog/?page_id=196 作者王聪，也是相当hard geek，从两个样章看，包含了相当多的内容。《C语言深度解剖》这本可以在百度文库或google搜到，可以读读，有些参考性。《C标准和实现》作者姚新颜，他的《深度探索C、C++》算是当年比较有深度的书籍，可惜已经绝版了。这本书也可以在百度文库搜到。这本书也比较值得读。良葛格C语言学习笔记 http://caterpillar.onlyfun.net/Gossip/CGossip/CGossip.html C与C++的兼容性问题 http://en.wikipedia.org/wiki/Compatibility_of_C_and_C%2B%2B 另一个文档关于C与C++标准兼容性问题：http://david.tribble.com/text/cdiffs.htm 《C Elements of Style》http://www.oualline.com/books.free/style/index.html 《Linux安全编程》http://www.dwheeler.com/secure-programs/ 《C Craft》电子版 http://crypto.stanford.edu/~blynn/c/ 《The function pointer tutorials》函数指针教程。http://www.newty.de/fpt/index.html C语言编程及Unix系统调用，想用C在Unix或者Linux编程的朋友可以参考。http://www.cs.cf.ac.uk/Dave/C/ 优化C、C++代码 http://www.eventhelix.com/RealtimeMantra/Basics/OptimizingCAndCPPCode.htm 图文并茂介绍C语言的指针 http://boredzo.org/pointers/ 另外一篇介绍C语言优化的文章 http://www.prism.uvsq.fr/~cedb/local_copies/lee.html 一个C语言教学ppt http://www.slideshare.net/petdance/just-enough-c-for-open-source-programmers 一些Unix下C语言编程相关的文章 http://users.actcom.co.il/~choo/lupg/tutorials/index.html Unix下如何建立静态、动态C语言函数库 http://users.actcom.co.il/~choo/lupg/tutorials/libraries/unix-c-libraries.html 如何使用GDB http://users.actcom.co.il/~choo/lupg/tutorials/debugging/debugging-with-gdb.html 一些C语言编程技巧 http://users.bestweb.net/~ctips/ Advanced C programming，高级C语言编程，可以提高水平，非常有帮助 http://www.mpi-inf.mpg.de/departments/rg1/teaching/advancedc-ws08/literature.html C语言问答，这些题目也可用于面试 http://www.gowrikumar.com/c/

python正则表达式初使用

编程 Python | 2012-01-21 22:05:45 | 0 COMMENT

想要实现post提交一个表单，直接urllib.urlencode，不知道为什么不行。采用直接提交的方式发现行得通，但是问题来了，其中一个表单时类似学号一样的8位数字，需要修改。正好用到正则表达式。

post_data = ""
strRe = r"[0-9]{8}"
reObj = re.compile(strRe)
print reObj.findall(post_data)

实现查找，有一个方法可以直接替换，更方便：

repl = "XXXXXXXX"
print reObj.sub(repl, post_data)

开始听到群里说正则表达式很难，但通过学习发现，处理个小问题还是很简单的。很方便。

django学习笔记-django.contrib.auth.views.password_change修改密码

Django | 2012-01-18 19:45:26 | 1 COMMENT

利用auth.views.password_change修改密码： urls.py urlpatterns = patterns('', url(r'passwdchange/$','django.contrib.auth.views.password_change',{'template_name':'users/passwdchange.html','post_change_redirect':'password_changed'}), ) post_change_redirect :密码修改后，URL重定向到 password_changed 开始没有写这个，只写了template_name。报错： Reverse for 'django.contrib.auth.views.password_change_done' with arguments '()' and keyword arguments '{}' not found. 看官网post_change_redirect 可以不写。 https://docs.djangoproject.com/en/1.3/topics/auth/#django.contrib.auth.views.password_change 找了几个网站，看后面都跟有，而且名字不同。纳闷了

正则表达式-收集常用

编程 | 2012-01-18 12:58:03 | 0 COMMENT

学习链接：http://0x55aa.sinaapp.com/%e7%ae%97%e6%b3%95-%e7%bc%96%e7%a8%8b/211.html http://0x55aa.sinaapp.com/%e7%ae%97%e6%b3%95-%e7%bc%96%e7%a8%8b/212.html 匹配中文，英文字母和数字及_:^[\u4e00-\u9fa5_a-zA-Z0-9]+$ 同时判断输入长度：[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10} ^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$ 1、一个正则表达式，只含有汉字、数字、字母、下划线不能以下划线开头和结尾： ^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$ 其中： ^ 与字符串开始的地方匹配 (?!_)　　不能以_开头 (?!.*?_$)　　不能以_结尾 [a-zA-Z0-9_\u4e00-\u9fa5]+　　至少一个汉字、数字、字母、下划线 $　　与字符串结束的地方匹配放在程序里前面加@，否则需要\\进行转义 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$" （或者：@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " ) 2、只含有汉字、数字、字母、下划线，下划线位置不限： ^[a-zA-Z0-9_\u4e00-\u9fa5]+$ 3、由数字、26个英文字母或者下划线组成的字符串 ^\w+$ 4、2~4个汉字 @"^[\u4E00-\u9FA5]{2,4}$"; 匹配中文字符的正则表达式： [u4e00-u9fa5] 评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^x00-xff] 评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）匹配空白行的正则表达式：ns*r 评注：可以用来删除空白行匹配HTML标记的正则表达式：< (S*?)[^>]*>.*?|< .*? /> 评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力匹配首尾空白字符的正则表达式：^s*|s*$ 评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 评注：表单验证时很实用匹配网址URL的正则表达式：[a-zA-z]+://[^s]* 评注：网上流传的版本功能很有限，上面这个基本可以满足需求匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 评注：表单验证时很实用匹配国内电话号码：d{3}-d{8}|d{4}-d{7} 评注：匹配形式如 0511-4405222 或 021-87888822 匹配腾讯QQ号：[1-9][0-9]{4,} 评注：腾讯QQ号从10000开始匹配中国邮政编码：[1-9]d{5}(?!d) 评注：中国邮政编码为6位数字匹配身份证：d{15}|d{18} 评注：中国的身份证为15位或18位匹配ip地址：d+.d+.d+.d+ 评注：提取ip地址时有用匹配特定数字： ^[1-9]d*$　　 //匹配正整数 ^-[1-9]d*$ 　 //匹配负整数 ^-?[1-9]d*$　　 //匹配整数 ^[1-9]d*|0$　 //匹配非负整数（正整数 + 0） ^-[1-9]d*|0$　　 //匹配非正整数（负整数 + 0） ^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮点数 ^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配负浮点数 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮点数 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非负浮点数（正浮点数 + 0） ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮点数（负浮点数 + 0）评注：处理大量数据时有用，具体应用时注意修正匹配特定字符串： ^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串 ^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串 ^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串 ^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串 ^w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下: 只能输入数字：“^[0-9]*$” 只能输入n位的数字：“^d{n}$” 只能输入至少n位数字：“^d{n,}$” 只能输入m-n位的数字：“^d{m,n}$” 只能输入零和非零开头的数字：“^(0|[1-9][0-9]*)$” 只能输入有两位小数的正实数：“^[0-9]+(.[0-9]{2})?$” 只能输入有1-3位小数的正实数：“^[0-9]+(.[0-9]{1,3})?$” 只能输入非零的正整数：“^+?[1-9][0-9]*$” 只能输入非零的负整数：“^-[1-9][0-9]*$” 只能输入长度为3的字符：“^.{3}$” 只能输入由26个英文字母组成的字符串：“^[A-Za-z]+$” 只能输入由26个大写英文字母组成的字符串：“^[A-Z]+$” 只能输入由26个小写英文字母组成的字符串：“^[a-z]+$” 只能输入由数字和26个英文字母组成的字符串：“^[A-Za-z0-9]+$” 只能输入由数字、26个英文字母或者下划线组成的字符串：“^w+$” 验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为：以字母开头，长度在6-18之间，只能包含字符、数字和下划线。验证是否含有^%&’,;=?$”等字符：“[^%&',;=?$x22]+” 只能输入汉字：“^[u4e00-u9fa5],{0,}$” 验证Email地址：“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$” 验证InternetURL：“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$” 验证电话号码：“^((d{3,4})|d{3,4}-)?d{7,8}$” 正确格式为：“XXXX-XXXXXXX”，“XXXX-XXXXXXXX”，“XXX-XXXXXXX”， “XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。验证身份证号（15位或18位数字）：“^d{15}|d{}18$” 验证一年的12个月：“^(0?[1-9]|1[0-2])$”正确格式为：“01”-“09”和“1”“12” 验证一个月的31天：“^((0?[1-9])|((1|2)[0-9])|30|31)$” 正确格式为：“01”“09”和“1”“31”。匹配中文字符的正则表达式： [u4e00-u9fa5] 匹配双字节字符(包括汉字在内)：[^x00-xff] 匹配空行的正则表达式：n[s| ]*r 匹配HTML标记的正则表达式：/< (.*)>.*|< (.*) />/ 匹配首尾空格的正则表达式：(^s*)|(s*$) 匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 匹配网址URL的正则表达式：http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

研究Python正则表达式-只含有汉字、数字、字母、下划线

编程 Python Django | 2012-01-18 12:52:57 | 0 COMMENT

找到的一点资料： \u4e00-\u9fa5 (中文) \x3130-\x318F (韩文) \xAC00-\xD7A3 (韩文) \u0800-\u4e00 (日文) \ufe30-\uffa0(全角字符) 找到一篇好文章：http://0x55aa.sinaapp.com/%E7%AE%97%E6%B3%95-%E7%BC%96%E7%A8%8B/212.html 没有系统的学习正则表达式，准备现学现用。但是发现不匹配但就是找不到问题。只含有汉字、数字、字母、下划线：

if not re.search(u'^[_a-zA-Z0-9\u4e00-\u9fa5]+$',username):
raise forms.ValidationError('用户名中只能包含')

Python正则表达式指南-收藏

Python | 2012-01-18 12:49:30 | 0 COMMENT

1. 正则表达式基础

1.1. 简单介绍

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式，只需要简单看一看就可以上手了。下图展示了使用正则表达式进行匹配的流程：

: 正则表达式

正则表达式的大致匹配过程是：依次拿出表达式和文本中的字符比较，如果每一个字符都能匹配，则匹配成功；一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界，这个过程会稍微有一些不同，但也是很好理解的，看下图中的示例以及自己多使用几次就能明白。下图列出了Python支持的正则表达式元字符和语法：

: 正则表达式图片

1.2. 数量词的贪婪模式与非贪婪模式

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；非贪婪的则相反，总是尝试匹配尽可能少的字符。例如：正则表达式"ab*"如果用于查找"abbbc"，将找到"abbb"。而如果使用非贪婪的数量词"ab*?"，将找到"a"。

1.3. 反斜杠的困扰

与大多数编程语言相同，正则表达式里使用"\"作为转义字符，这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\"，那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\"：前两个和后两个分别用于在编程语言里转义成反斜杠，转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。Python里的原生字符串很好地解决了这个问题，这个例子中的正则表达式可以使用r"\\"表示。同样，匹配一个数字的"\\d"可以写成r"\d"。有了原生字符串，你再也不用担心是不是漏写了反斜杠，写出来的表达式也更直观。

1.4. 匹配模式

正则表达式提供了一些可用的匹配模式，比如忽略大小写、多行匹配等，这部分内容将在Pattern类的工厂方法re.compile(pattern[, flags])中一起介绍。

2. re模块

2.1. 开始使用re

Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例，然后使用Pattern实例处理文本并获得匹配结果（一个Match实例），最后使用Match实例获得信息，进行其他的操作。

# encoding: UTF-8
import re

# 将正则表达式编译成Pattern对象
pattern = re.compile(r'hello')

# 使用Pattern匹配文本，获得匹配结果，无法匹配时将返回None
match = pattern.match('hello world!')

if match:
    # 使用Match获得分组信息
    print match.group()

### 输出 ###
# hello

re.compile(strPattern[, flag]): 这个方法是Pattern类的工厂方法，用于将字符串形式的正则表达式编译为Pattern对象。第二个参数flag是匹配模式，取值可以使用按位或运算符'|'表示同时生效，比如re.I | re.M。另外，你也可以在regex字符串中指定模式，比如re.compile('pattern', re.I | re.M)与re.compile('(?im)pattern')是等价的。可选值有：

re.I(re.IGNORECASE): 忽略大小写（括号内是完整写法，下同）
M(MULTILINE): 多行模式，改变'^'和'$'的行为（参见上图）
S(DOTALL): 点任意匹配模式，改变'.'的行为
L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行，忽略空白字符，并可以加入注释。以下两个正则表达式是等价的：

a = re.compile(r"""\d +  # the integral part
                   \.    # the decimal point
                   \d *  # some fractional digits""", re.X)
b = re.compile(r"\d+\.\d*")

re提供了众多模块方法用于完成正则表达式的功能。这些方法可以使用Pattern实例的相应方法替代，唯一的好处是少写一行re.compile()代码，但同时也无法复用编译后的Pattern对象。这些方法将在Pattern类的实例方法部分一起介绍。如上面这个例子可以简写为：

m = re.match(r'hello', 'hello world!')
print m.group()

re模块还提供了一个方法escape(string)，用于将string中的正则表达式元字符如*/+/?等之前加上转义符再返回，在需要大量匹配元字符时有那么一点用。

2.2. Match

Match对象是一次匹配的结果，包含了很多关于此次匹配的信息，可以使用Match提供的可读属性或方法来获取这些信息。属性：

string: 匹配时使用的文本。
re: 匹配时使用的Pattern对象。
pos: 文本中正则表达式开始搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
endpos: 文本中正则表达式结束搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
lastindex: 最后一个被捕获的分组在文本中的索引。如果没有被捕获的分组，将为None。
lastgroup: 最后一个被捕获的分组的别名。如果这个分组没有别名或者没有被捕获的分组，将为None。

方法：

group([group1, …]): 获得一个或多个分组截获的字符串；指定多个参数时将以元组形式返回。group1可以使用编号也可以使用别名；编号0代表整个匹配的子串；不填写参数时，返回group(0)；没有截获字符串的组返回None；截获了多次的组返回最后一次截获的子串。
groups([default]): 以元组形式返回全部分组截获的字符串。相当于调用group(1,2,…last)。default表示没有截获字符串的组以这个值替代，默认为None。
groupdict([default]): 返回以有别名的组的别名为键、以该组截获的子串为值的字典，没有别名的组不包含在内。default含义同上。
start([group]): 返回指定的组截获的子串在string中的起始索引（子串第一个字符的索引）。group默认值为0。
end([group]): 返回指定的组截获的子串在string中的结束索引（子串最后一个字符的索引+1）。group默认值为0。
span([group]): 返回(start(group), end(group))。
expand(template): 将匹配到的分组代入template中然后返回。template中可以使用\id或\g<id>、 \g<name>引用分组，但不能使用编号0。\id与\g<id>是等价的；但\10将被认为是第10个分组，如果你想表达 \1之后是字符'0'，只能使用\g<1>0。

import re
m = re.match(r'(\w+) (\w+)(?P<sign>.*)', 'hello world!')

print "m.string:", m.string
print "m.re:", m.re
print "m.pos:", m.pos
print "m.endpos:", m.endpos
print "m.lastindex:", m.lastindex
print "m.lastgroup:", m.lastgroup

print "m.group(1,2):", m.group(1, 2)
print "m.groups():", m.groups()
print "m.groupdict():", m.groupdict()
print "m.start(2):", m.start(2)
print "m.end(2):", m.end(2)
print "m.span(2):", m.span(2)
print r"m.expand(r'\2 \1\3'):", m.expand(r'\2 \1\3')

### output ###
# m.string: hello world!
# m.re: <_sre.SRE_Pattern object at 0x016E1A38>
# m.pos: 0
# m.endpos: 12
# m.lastindex: 3
# m.lastgroup: sign
# m.group(1,2): ('hello', 'world')
# m.groups(): ('hello', 'world', '!')
# m.groupdict(): {'sign': '!'}
# m.start(2): 6
# m.end(2): 11
# m.span(2): (6, 11)
# m.expand(r'\2 \1\3'): world hello!

2.3. Pattern

Pattern对象是一个编译好的正则表达式，通过Pattern提供的一系列方法可以对文本进行匹配查找。 Pattern不能直接实例化，必须使用re.compile()进行构造。 Pattern提供了几个可读属性用于获取表达式的相关信息：

pattern: 编译时用的表达式字符串。
flags: 编译时用的匹配模式。数字形式。
groups: 表达式中分组的数量。
groupindex: 以表达式中有别名的组的别名为键、以该组对应的编号为值的字典，没有别名的组不包含在内。

import re
p = re.compile(r'(\w+) (\w+)(?P<sign>.*)', re.DOTALL)

print "p.pattern:", p.pattern
print "p.flags:", p.flags
print "p.groups:", p.groups
print "p.groupindex:", p.groupindex

### output ###
# p.pattern: (\w+) (\w+)(?P<sign>.*)
# p.flags: 16
# p.groups: 3
# p.groupindex: {'sign': 3}

实例方法[ | re模块方法]：

match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]): 这个方法将从string的pos下标处起尝试匹配pattern；如果pattern结束时仍可匹配，则返回一个Match对象；如果匹配过程中pattern无法匹配，或者匹配未结束就已到达endpos，则返回None。 pos和endpos的默认值分别为0和len(string)；re.match()无法指定这两个参数，参数flags用于编译pattern时指定匹配模式。注意：这个方法并不是完全匹配。当pattern结束时若string还有剩余字符，仍然视为成功。想要完全匹配，可以在表达式末尾加上边界匹配符'$'。示例参见2.1小节。
search(string[, pos[, endpos]]) | re.search(pattern, string[, flags]): 这个方法用于查找字符串中可以匹配成功的子串。从string的pos下标处起尝试匹配pattern，如果pattern结束时仍可匹配，则返回一个Match对象；若无法匹配，则将pos加1后重新尝试匹配；直到pos=endpos时仍无法匹配则返回None。 pos和endpos的默认值分别为0和len(string))；re.search()无法指定这两个参数，参数flags用于编译pattern时指定匹配模式。
```
# encoding: UTF-8 
import re 

# 将正则表达式编译成Pattern对象 
pattern = re.compile(r'world') 

# 使用search()查找匹配的子串，不存在能匹配的子串时将返回None 
# 这个例子中使用match()无法成功匹配 
match = pattern.search('hello world!') 

if match: 
    # 使用Match获得分组信息 
    print match.group() 

### 输出 ### 
# world
```
split(string[, maxsplit]) | re.split(pattern, string[, maxsplit]): 按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数，不指定将全部分割。
```
import re

p = re.compile(r'\d+')
print p.split('one1two2three3four4')

### output ###
# ['one', 'two', 'three', 'four', '']
```
findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags]): 搜索string，以列表形式返回全部能匹配的子串。
```
import re

p = re.compile(r'\d+')
print p.findall('one1two2three3four4')

### output ###
# ['1', '2', '3', '4']
```
finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags]): 搜索string，返回一个顺序访问每一个匹配结果（Match对象）的迭代器。
```
import re

p = re.compile(r'\d+')
for m in p.finditer('one1two2three3four4'):
    print m.group(),

### output ###
# 1 2 3 4
```
sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]): 使用repl替换string中每一个匹配的子串后返回替换后的字符串。当repl是一个字符串时，可以使用\id或\g<id>、\g<name>引用分组，但不能使用编号0。当repl是一个方法时，这个方法应当只接受一个参数（Match对象），并返回一个字符串用于替换（返回的字符串中不能再引用分组）。 count用于指定最多替换次数，不指定时全部替换。
```
import re

p = re.compile(r'(\w+) (\w+)')
s = 'i say, hello world!'

print p.sub(r'\2 \1', s)

def func(m):
    return m.group(1).title() + ' ' + m.group(2).title()

print p.sub(func, s)

### output ###
# say i, world hello!
# I Say, Hello World!
```

subn(repl, string[, count]) |re.sub(pattern, repl, string[, count]): 返回 (sub(repl, string[, count]), 替换次数)。

import re

p = re.compile(r'(\w+) (\w+)')
s = 'i say, hello world!'

print p.subn(r'\2 \1', s)

def func(m):
    return m.group(1).title() + ' ' + m.group(2).title()

print p.subn(func, s)

### output ###
# ('say i, world hello!', 2)
# ('I Say, Hello World!', 2)

以上就是Python对于正则表达式的支持。熟练掌握正则表达式是每一个程序员必须具备的技能，这年头没有不与字符串打交道的程序了。地址：http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

Django判断数据库中是否有该记录

编程 Python Django | 2012-01-18 00:06:35 | 0 COMMENT

利用Django表单实现用户注册，检测数据库中是否有该用户。方法查到的比较好的一种方法 get(**kwargs) 以下文描述的 "字段查询" 格式返回匹配查找参数的对象.如果没有找到符合给定参数的对象,会引发一个模块级的DoesNotExist 异常. 如果找到不止一个对象,引发AssertionError 异常.

from django.core.exceptions import ObjectDoesNotExist
try:
#判断用户名是否被注册
    User.objects.get(username=username)
except ObjectDoesNotExist:
    return username
raise forms.ValidationError('改用户名已存在')

Django web : CSRF verification failed. Request aborted.

Python WEB Django | 2012-01-17 19:41:10 | 0 COMMENT

CSRF verification failed. Request aborted.

Help Reason given for failure: CSRF token missing or incorrect. 解决方案：在Settings里的MIDDLEWARE_CLASSES增加配置： 'django.middleware.csrf.CsrfViewMiddleware', 'django.middleware.csrf.CsrfResponseMiddleware',