Lucene 全文检索实践(3)

Posted on 21st June 2004 by Nio in Lucene, 程序人生

今天总算有些空闲时间,正好说说第二种方案:使用 mod_jk 做桥接的方式,将 servlet 引擎结合到 httpd 中。

环境
* PHP 4.3.6 prefix=/usr
* Apache 1.3.27 prefix=/usr/local/apache
* j2sdk1.4.1_01 prefix=/usr/local/jdk
* jakarta-tomcat-4.1.24 prefix=/usr/local/tomcat
* 另外需要下载 jakarta-tomcat-connectors-jk-1.2.5-src.tar.gz

(more…)

Lucene 全文检索实践(2)

Posted on 17th June 2004 by Nio in Lucene, 程序人生

Java 的程序基本编写完成,实现了对中文的支持。下一步是将其放到 WEB 上运行,首先想到的是使用 JSP,安装了Apache Tomcat/4.1.24,默认的发布端口是 8080。现在面临的一个问题是:Apache httpd 的端口是 80,并且我的机器对外只能通过 80 端口进行访问,如果将 Tomcat 的发布端口改成 80 的话,httpd 就没法对外了,而其上的 PHP 程序也将无法在 80 端口运行。

对于这个问题,我想到两种方案:
1、使用 PHP 直接调用 Java。需要做的工作是使用 –with-java 重新编译 PHP;
2、使用 mod_jk 做桥接的方式,将 servlet 引擎结合到 httpd 中。需要做的工作是编译 jakarta-tomcat-connectors-jk-1.2.5-src,生成 mod_jk.so 给 httpd 使用,然后按照 Howto 文档 进行 Tomcat、httpd 的配置。

对于第一个方案的尝试:使用 PHP 直接调用 Java

环境
* PHP 4.3.6 prefix=/usr
* Apache 1.3.27 prefix=/usr/local/apache
* j2sdk1.4.1_01 prefix=/usr/local/jdk

(more…)

Lucene 全文检索实践(1)

Posted on 15th June 2004 by Nio in Lucene, 程序人生

Lucene 是 Apache Jakarta 的一个子项目,是一个全文检索的搜索引擎库。其提供了简单实用的 API,通过这些 API,可以自行编写对文件(TEXT/XML/HTML等)、目录、数据库的全文检索程序。
Features:
* Very fast indexing, minimal RAM required
* Index compression to 30% of original text
* Indexes text and HTML, document classes available for XML, PDF and RTF
* Search supports phrase and Boolean queries, plus, minus and quote marks, and parentheses
* Allows single and multiple character wildcards anywhere in the search words, fuzzy search, proximity
* Will search for punctuation such as + or ?
* Field searches for title, author, etc., and date-range searching
* Supports most European languages
* Option to store and display full text of indexed documents
* Search results in relevance order
* APIs for file format conversion, languages and user interfaces

(more…)

Apache 在亚洲各国(地区)的受欢迎程度比较

Posted on 14th June 2004 by Nio in 程序人生

参见:Comparative popularity of Apache in Asia

比较列表如下:

Rank Country/District Apache% IIS%
1 Japan 73 9
2= Indonesia 70 23
2= Korea 70 25
- Global average 67 21
4= Philippines 60 24
4= New Zealand 60 30
6 Pakistan 57 28
7= Thailand 54 38
7= Australia 54 38
9 Taiwan 47 46
10 Singapore 45 40
11 Malaysia 42 51
12 India 41 49
13 China 35 56

可以看出,国内还是使用 IIS 居多,而日本则 Apache 占绝大多数,这其实可以作为某一方面应用水平的比较,国人还有待努力呀~

欧洲杯 :: 英格兰 vs 法国

Posted on 14th June 2004 by Nio in 日常生活

昨晚半夜爬起来看欧洲杯,英格兰 vs 法国。英格兰一直于 1:0 领先,但从 David Beckham 没有罚进点球开始,英格兰就注定了将要输掉这场比赛,法国队在最后3分钟的必杀技,任意球+点救,简洁明快地阻击了英格兰。对于英格兰而言,虽然有些可惜,但队中涌现出一批希望之星,值得期待的年份应该是 2006。 而法国队中过多的球星没能起到应有的作用。

这场比赛中值得比较的是 Beckham 与 Zidane。
俩人都通过任意球为本队得分,前者是传球,后者是直接破门;
俩人都罚了点球,前者没有罚进,后者则罚进了;
而恰恰是这种区别,法国队战胜了英格兰。