捐赠 | 广告 | 注册 | 发布 | 上传 | 关于我们    
  粤ICP备10103342号-1 DELPHI盒子 | 盒子文章 | 盒子问答悬赏 | 最新更新 | 盒子检索 | 下载中心 | 高级搜索    
  精品专区 | 繁體中文 | 奖励公告栏 | 直通车账号登陆 | 关闭GOOGLE广告 | 临时留言    
 
广告
评论:从网页存档文件MHT里提取附件 v3.0
risingsoft 31508 2007/10/22 12:30:13
其实只要MHT文档里的实体采用BASE64编码都是可以提取的.
Content-Type: image/jpg
Content-Transfer-Encoding: base64

思路:
1.找到Content-Transfer-Encoding: base64行,可以确定是BASE64编码
2.Content-Type: image/jpg里的附件类型与界面的附件类型比较,符合界面设置则提取,否则抛弃
3.将所有BASE64实体内容提取出来.解密保存.
risingsoft 31507 2007/10/22 12:25:33
呵呵!其实都可以提取的.

附件类型:输入MHT的文档类型.比如:text/html,不过JS.CSS一般都不会用BASE64编码,也就是说MHT里不包含实体,只是URL.

扩展名:JS,CSS都可以加进来,比如:.js,.css.但是有个限制,这些URL在MHT里的标记必须为:src=3D"URL",这样就可以通过内置的下载功能下载这些附件

保证内置下载器下载的条件:
1.去掉"禁止下载"选项
2.远程URL指向的附件大小必须>=尺寸限制*1024(字节)
fengguohua 31473 2007/10/18 16:22:37
呵呵,到底你看没看标题啊?难道.JS、.CSS、HTML不是附件?对于MHT格式来说,.JS、.CSS、HTML、图片都是附件。
呵呵...
dongmenbianxue 31470 2007/10/18 13:09:21
看一下标题啊。说明了是提取附件。
gooood 31440 2007/10/15 8:49:26
还是要说谢谢,好人啊!
fengguohua 31417 2007/10/12 20:11:59
我运行了一下,不明白为什么只提取图片呢?MHT里面还包括HTML、JS、CSS,这些为什么不提取呢?这样也不完全啊,是不是?
第一页 上一页 下一页 最后页 有 6 条纪录 共1页 1 - 6
 用户名:
 密 码:
自动登陆(30天有效)
 
  DELPHI盒子版权所有 技术支持:深圳市麟瑞科技有限公司 1999-2024 V4.01 粤ICP备10103342号-1 更新RSS列表