工大后院

 找回密码
 加入后院

扫一扫,访问微社区

QQ登录

只需一步,快速开始

搜索
查看: 2577|回复: 9

web形式搜索服务器端文本?

[复制链接]
发表于 2008-1-29 22:45 | 显示全部楼层 |阅读模式
是这样的
服务器上有开ftp
想做个web界面搜索服务器端ftp下的文本文件
网上查了一下,有两种方式,一种是fso取得文件名
另一种是开启服务器端的“索引服务”配合动态web页面来实现查询
大家有没做过类似的?
 楼主| 发表于 2008-1-29 23:01 | 显示全部楼层
读索引服务数据库
OLE DB Provider for Index Server (By Chris Maunder)
strConnect = _T("provider=msidxs;Data Source=MyCatalog;");


For more information, see: Microsoft OLE DB Provider for Microsoft Indexing Service.



[ 本帖最后由 2002070344 于 2008-1-29 23:07 编辑 ]
回复

使用道具 举报

 楼主| 发表于 2008-1-29 23:29 | 显示全部楼层
找了一个连接字符串很好的帮助网站
http://www.connectionstrings.com/
回复

使用道具 举报

 楼主| 发表于 2008-1-29 23:45 | 显示全部楼层
索引服务属性
http://www.loverat.cn/bbshtml/ismain-concepts_38.html



该表包含了在查询时肯定有效的标准属性名列表。其他属性名也可能有效。
有关使用属性名进行查询的信息,请参阅索引服务帮助中的 指定属性名
表中显示的数据类型用于向属性缓存添加属性。创建查询时不需要这些数据类型。
好记的名称说明数据类型
Access该文档的上次访问时间VT_FILETIME
All搜索字符串的每个属性。该属性可以查询但不能检索不适用
AllocSize分配给文档的磁盘大小VT_I8
Attrib文档属性。请参阅“Windows XP 平台软件开发工具包”VT_UI4
ClassId文档对象的类别标识(例如 Microsoft Word)VT_CLSID
Characterization文档的描述或摘要。这是由“索引服务”生成的VT_LPWSTR
Contents文档的主要内容。该属性可以查询但不能检索不适用
Created文档的创建时间VT_FILETIME
Directory文档的物理路径,不包括文档名VT_LPWSTR
DocAppName创建文档的应用程序的名称VT_LPSTR
DocAuthor文档的作者VT_LPSTR
DocByteCount文档的字节数VT_I4
DocCategory文档的类型(如备忘录、计划或白皮书)VT_LPSTR
DocCharCount文档中包含的字符数VT_I4
DocComments文档的注释VT_LPSTR
DocCompany公司名称(该文档是给哪个公司编写的)VT_LPSTR
DocCreatedTm文档的创建时间VT_FILETIME
DocEditTime编辑文档总共花费的时间VT_FILETIME
DocHiddenCountMicrosoft PowerPoint 文档中隐藏的幻灯片数量VT_I4
DocKeywords文档的关键字VT_LPSTR
DocLastAuthor最近一次编辑过文档的用户VT_LPSTR
DocLastPrinted最近一次打印文档的时间VT_FILETIME
DocLastSavedTm最后一次保存文档时间VT_FILETIME
DocLineCount文档的行数VT_I4
DocManager文档作者的经理的名称VT_LPSTR
DocNoteCountMicrosoft PowerPoint 文档中有附注的页数VT_I4
DocPageCount文档的页数VT_I4
DocParaCount文档中的段落数VT_I4
DocPartTitles文档各部分的名称,例如 Microsoft Excel 文档中的电子表格名称或 Microsoft PowerPoint 幻灯片的幻灯片标题VT_LPSTR
DocPresentationTarget用于在 Microsoft PowerPoint 中演示文稿的目标格式(例如 35 毫米幻灯片、打印机、视频)VT_LPSTR
DocRevNumber文档的当前版本号VT_LPSTR
DocSlideCountMicrosoft PowerPoint 文档中的幻灯片数VT_I4
DocSubject文档主题VT_LPSTR
DocTemplate文档摸板的名称VT_LPSTR
DocTitle文档的标题VT_LPSTR
DocWordCount文档中包含的字数VT_I4
FileIndex文档的唯一 IDVT_I8
FileName文档的名称VT_LPWSTR
HitCount文档中的点击数(结果列表中的元素)VT_I4
HtmlHRefHTML 链接文本 (HREF)。该属性可以查询但不能检索VT_LPWSTR
HtmlHeading1 到 6采用样式 H1 到 H6 的 HTML 文档文本。该属性可以查询但不能检索VT_LPWSTR
MediaEditor文档主编辑器的名称VT_LPWSTR
MediaOwner文档所有者,例如授权使用该文档的组VT_LPWSTR
MediaProduction媒体的制作日期VT_FILETIME
MediaProject文档内容的所属项目VT_LPWSTR
MediaRating质量或内容的等级VT_LPWSTR
MediaSquence_No组中媒体文档的序号VT_LPWSTR
MediaSource文档来源的名称,如摄影师VT_LPWSTR
MediaStatus工程工作流程中的文档状态,其中,0=Draft, 1=Edit, 2=Final, 3=In Progress, 4=New, 5=Normal, 6=Other, 7=Preliminary, 8=Proof, 9=ReviewVT_UI4
MediaSupplier文档来源的名称,如授权使用该档案的一方VT_LPWSTR
Path文档的物理全路径,包括文档名VT_LPWSTR
Rank结果列表中项目与查询条件匹配的程度。其范围为 0 到 1,000。较大的数字表明更好的匹配VT_I4
RankVector向量查询的单个组件的级别。范围从 0 到 1,000。较大的数字表明更好的匹配VT_I4
ShortFileName短文档名称(8.3 格式)VT_LPWSTR
Size文档的大小,单位为字节VT_I8
VPath文档的虚拟全路径,包括文档名。如果存在多个可能的路径,将选择与指定查询最匹配的路径VT_LPWSTR
WorkId文档的内部 ID。用于“索引服务”内部VT_I4
Write上次修改(编写)文档的时间VT_FILETIME


[ 本帖最后由 2002070344 于 2008-1-29 23:47 编辑 ]
回复

使用道具 举报

发表于 2008-1-29 23:45 | 显示全部楼层
不是很明你的意思..

是不是这样可以实现:

在服务器后台写个脚本(如bash,perl,python等脚本),用于搜索ftp下的文件.
脚本接受参数作为搜索条件.返回文件列表.
从web传入参数,通过cgi程序调用脚本再在页面显示.(当然,也可以直接用cgi实现).
回复

使用道具 举报

 楼主| 发表于 2008-1-29 23:48 | 显示全部楼层
是的
回复

使用道具 举报

发表于 2008-1-29 23:58 | 显示全部楼层
script:
arg=$1
#validate the arguments the user pass.
#code is omited.
#Find the files. save in file.list file.
ls -l *${arg}* | awk '{print$9}' > file.list
#then you can display it in the web.

It is not a good method.
回复

使用道具 举报

发表于 2008-1-30 11:40 | 显示全部楼层
能带点注释吗
回复

使用道具 举报

发表于 2008-1-30 19:37 | 显示全部楼层
#7的伪脚本用的是linux的命令
ls -l *${arg}* | awk '{print$9}' > file.list
以长格式方式列出匹配的文件,用awk把文件名筛选出来.存入一个文件里.

.如果windows就不行了.
BTW,还需要考虑多用户同时搜索的情况,
所以,这只是一个思路,对实际应用意义不大.
回复

使用道具 举报

 楼主| 发表于 2008-2-3 22:12 | 显示全部楼层
用索引服务+asp解决了,迟点分享下小小经验
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入后院

本版积分规则

QQ|Archiver|手机版|小黑屋|广告业务Q|工大后院 ( 粤ICP备10013660号 )

GMT+8, 2025-8-30 10:45

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表