Nodejs爬虫实战(四)

1. 淘宝天猫页面重定向

  1. 尝试抓取淘宝页面

  2. 打印res.statusCode,res.headers.location

  3. res.statusCode返回的状态码;

    res.headers.location返回的地址

Nodejs爬虫实战(六)

1. 处理数据

  1. 上一步获取结果中含有p标签,用正则筛选,去掉标签,只留下文本。
    var myHtml = document.querySelector('.read-content').innerHTML.replace(/<[^>]+>/g,'')
  1. 统计词的个数首先需要文本分词

Nodejs爬虫实战(二)

1. 尝试抓取数据

  1. 引入模块httpfsfs为文件操作模块
  2. let 声明的变量只在 let 命令所在的代码块内有效
    1. 在ES6之前没有块级概念,let在所在区域内有效,和c语言中的变量作用域相同。

    2. var变量,函数内声明的变量作用域是局部的,外部就是全局的。

Java程序设计复习总结

Java程序设计期中复习总结

第一章 概述

1. 应用程序的结构:package import class
2. 源文件的扩展名.java,字节文件的扩展名:.class
3. Java语言的工作原理:先编译后解释
4. 一个源文件中最多可以有一个public类,并且文件名与public类名相同。
5. 常用命令javac编译,java运行。
6. 一个应用程序最少有一个main方法。