npm clean-mark,抓取网页文章内容,转换成markdown、html、txt
html
编程技术
发布日期
2023-07-17
更新日期
2023-07-17
阅读次数 192
文章字数 562
使用npm安装:
npm install clean-mark
找到安装路径下,有个bin目录,默认有二进制文件:clean-mark,提供执行命令
$ clean-mark <url> [OPTIONS]
Convert a blog article into a clean Markdown text file.
Options
-o, --output Specify output file name
(auto-generated by default)
--stdout Write to STDOUT instead of a file
-t, --type Specify output format type
(HTML, TEXT, or Markdown by default)
--name-title Use the title as output name
--nodb Don't use the A-Extractor database
(probably a bad idea)
生成markdown:clean-mark "http://xxxxx.html" -o /www/wwwroot/test
默认情况下,它自带.md后缀扩展名,如果想要转换成html,加-t html,例如:clean-mark "http://xxxxx.html" -o /www/wwwroot/test -t html
GitHub 源码:https://github.com/croqaz/clean-mark
文章作者: 朱丰华
文章链接: https://smart.52dixiaowo.com/blog/post-458.html
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。
html
发表评论
相关推荐