logo

Internet Download Manager

Internet Download Manager 抓取向导

 

在向导的第一步中,应指定起始页。默认情况下,假定使用 http 协议;其他协议(如 HTTPS)需要显式指定。 起始页还设置当前站点。例如,如果指定了 www.tonec.com/support/index.html,则当前站点将 www.tonec.com 所有支持的协议,如 FTP、 HTTPS、HTTP 应用于此站点名称。

 

Internet Download Manager Grabber Wizard 的第 1 步

 

如果站点需要授权,您还应在此步骤中设置登录名和密码。某些网站仅在特定页面上进行身份验证后才允许浏览/下载。在这种情况下,您应该按“高级>>”按钮, 选中“手动输入登录名和密码”框,并指定登录站点的页面。此外,如果站点有注销按钮,则应在此处指定 Grabber 不应打开的注销页面。 如果您设置了登录页面,Grabber 将在第四步后打开一个浏览器窗口,让您在继续浏览和下载之前手动登录该站点。

 

如果您打算保存抓取器项目以备后用,则需要选择一个唯一的项目名称,并将其输入到对话框顶部的“抓取器项目名称”字段中。 项目名称显示在主 IDM 对话框的类别树中的已保存项目列表中。

 

如果您需要从网站下载所有图片、视频或音频文件,或下载完整的网站,您可以在“项目模板”列表框中选择适当的模板。 项目模板使快速启动项目变得容易,因为所有必需的设置都是自动进行的。

 

但不必选择项目模板。项目模板在项目中进行预定义的设置,以便进行抓取器向导的后续步骤。如果您从具有相同 Grabber 设置的网站下载文件, 您可以在此步骤中选择模板,在下一阶段进行必要的设置,然后通过选择“项目→将当前设置另存为模板”菜单项将设置另存为模板。

 

第2步。选择保存文件的位置。

 

在第二步中,您需要选择保存所有下载文件的位置。

 

Internet Download Manager Grabber Wizard 的第 2 步

 

您可以根据文件的类别将每个文件保存到文件夹中。例如,如果您定义了“压缩文件”类别,其中列出了 ZIPARJ 和 RAR 文件类型, 并且它有一个关联的文件夹,例如,“C:\my documents\my name\downloads\compressed”,那么所有下载的 ZIP、ARJ 和 RAR 文件将保存到“C:\my documents\my name\downloads\compressed”文件夹中。

 

此外,您可以将所有下载的文件保存到与所选类别关联的文件夹中。您需要选择相应的单选按钮,然后选择一个类别。抓取器将找到并显示类别下方的目录。

 

如果要创建在网站上创建的所有文件夹,可以选择保存所有下载文件的目录,然后选中“使用原始相对子文件夹”框。

 

如果要下载完整的网站或网站的一部分,可以选中该框以将链接转换为本地链接以供脱机浏览。当您在第一步中选择不需要保存任何 html 页面的模板时,此复选框将被禁用, 例如,“网站中的所有图像”模板。下载所有选定文件或停止抓取器后,抓取器会将下载文件的链接转换为每个下载网页的本地相对文件。 此外,抓取器会将所有指向未下载文件(远程文件)的链接转换为绝对互联网链接。

 

如果未选中“覆盖现有文件”框,并且已存在同名文件,则抓取器将在文件名中添加下划线和数字,例如index_2.html

 

没有必要选中“将选中的文件添加到IDM”框,Grabber主窗口工具栏有一个具有相同功能的按钮,可以将所有选定的文件添加到Internet下载管理器的主下载列表中。 如果选中此复选框,则抓取器将在关闭抓取器时自动将所选文件添加到IDM。

 

第 3 步。设置文件过滤器。

 

在此步骤中,应指定要浏览的网页以搜索所需文件。请注意,您仅为浏览的网页设置条件。您可以在下一步中为下载的文件设置文件类型、位置和其他过滤器。

 

Internet Download Manager Grabber Wizard 的第 3 步

 

在第一步中指定的起始页将设置要浏览的当前网站。例如,如果指定了 www.tonec.com/support/index.html, 当前站点将 www.tonec.com 所有受支持的协议应用于此站点名称,如 https://www.tonec.com 和 ftp://www.tonec.com。 在此步骤中,您可以告诉抓取器仅查找当前站点上的所有文件,也可以指定要在当前(此)站点上处理的网页级别数以及要在其他站点上处理的网页级别数。单击此处了解链接级别的数量。小心为其他站点设置大量级别,因为它可能会减慢 IDM 显示无用文件的速度, 它可能导致处理数百万个不必要的页面。

 

如果选中“忽略弹出窗口”框,则抓取器将不会浏览页面加载期间浏览器中弹出的网页。请注意,弹出窗口术语不适用于 Grabber,它适用于 Web 浏览器。 抓取卡不会打开任何浏览器窗口,除非您使用手动身份验证。

 

如果起始网页具有相对于站点名称的路径(例如 www.tonec.com/support/index.html),则“不浏览父目录”复选框将处于活动状态。 如果选中“不浏览父目录”框,则抓取器将不会浏览相对于起始页的父目录。例如,对于 www.tonec.com/support/index.html,抓取器不会浏览 www.tonec.com/index.html 并 www.tonec.com/other folder/index.html, 但会探索 www.tonec.com/support/file.html 和 www.tonec.com/support/other folder/index.html

 

如果您选中“浏览主域内的所有站点”框,则抓取器将浏览与起始页域具有共同部分的所有其他域。例如,对于 www.tonec.com/support/index.html, 抓取者将探索 https://tonec.comhttps://ftp.tonec.com 和 https://some-other-domain.tonec.com。在子域上,Grabber 将浏览为当前站点指定的级别数。

 

抓取器还可以在页面上运行 Java 脚本并解析其结果。这样,您可以从站点检索更多链接,但应谨慎使用此功能

 

如果单击“高级>>”按钮,对话框将展开,并允许您为需要浏览页面的域/路径指定包含和排除过滤器。 您可以使用星号通配符 (*) 来匹配任意数量的任意字符,以创建筛选器模式。

 

第 4 步。设置站点资源管理器筛选器。

 

在此步骤中,您应该为下载的文件设置文件类型、位置和其他过滤器。您可以为所有文件类型设置包含和排除过滤器。

 

Internet Download Manager Grabber Wizard 的第 4 步

 

如果您对预定义的过滤器不满意,可以使用“添加过滤器”按钮添加/更改它们。单击“添加过滤器”后,将出现以下“编辑过滤器”对话框。

 

Internet Download Manager Grabber 向导的步骤 4 中可用的过滤器列表

 

对于包含多种文件类型的筛选器,文件类型元素应使用逗号(不带空格)相互分隔。星号通配符 (*) 表示任意数量的任意字符。 使用通配符,您可以创建与多个文件名匹配的模式,例如“image*.jpg”模式匹配任何以“image”单词开头的 JPG 图像文件名,例如 image01.jpg、image2.jpg、imageHot.jpg 和 image735.jpg。可以在筛选器中使用“<起始页>”表达式来指定第一步中设置的起始页。

 

如果您选中“仅在此站点上搜索文件”框,则位于其他站点上的文件将不会显示在Grabber主窗口中,并且Grabber不会检查这些文件的大小和类型。

 

在探索项目期间,Grabber 很可能会在不同位置找到同一文件的多个副本。如果选中“隐藏在不同位置找到的重复文件”, 抓取器将仅显示它找到的文件的第一个副本。如果文件具有相同的名称和大小,则抓取器会将其视为副本。在步骤 2 中启用“使用原始相对子文件夹”选项时,此选项将被禁用。

 

如果您选中“一次开始下载所有匹配的文件”,则所有找到的文件将立即下载。 您可以先浏览该站点,检查所需的文件,然后在 Grabber 主窗口中下载它们,或将它们添加到 IDM 的主列表中。

 

“高级>>”按钮展开对话框,并允许您为抓取器将从中下载文件的路径/域设置包含和排除过滤器。 您可以使用星号通配符 (*) 来表示任意数量的任意字符。此外,您可以设置要下载的文件的最小和最大大小。

 

 

Facebook
Twitter