本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长


+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

Excel VBA - 使用 XMLHTTP (MSXML2.XMLHTTP) 抓取 Google

发布于2022-04-19 02:14     阅读(1001)     评论(0)     点赞(25)     收藏(1)


我正在尝试为 Google 新闻上的某些新闻主题汇总每日事件表。

在一个模块中,我有以下内容:

Option Explicit
Private Declare Function URLDownloadToFile Lib "urlmon" _
Alias "URLDownloadToFileA" (ByVal pCaller As Long, _
ByVal szURL As String, ByVal szFileName As String, _
ByVal dwReserved As Long, ByVal lpfnCB As Long) As Long

Dim ret As Long

Sub Go()

Dim url As String, i As Integer, numb_H3 As Integer, lastRow As Long, XMLHTTP As Object, html As Object, objResultDiv As Object, objH3 As Object, link As Object, j1 As Object

url = "https://www.google.co.uk/search?q=" & "Wearables" & "&tbm=nws" ' "&rnd=" & WorksheetFunction.RandBetween(1, 10000)

Set XMLHTTP = CreateObject("MSXML2.XMLHTTP")
XMLHTTP.Open "GET", url, False
XMLHTTP.setRequestHeader "Content-Type", "text/xml"
XMLHTTP.send
Set html = CreateObject("htmlfile")
html.body.innerHTML = XMLHTTP.ResponseText
Set objResultDiv = html.getElementById("rso")
numb_H3 = objResultDiv.GetElementsByTagname("H3").Length
For i = 0 To numb_H3 - 1
If numb_H3 > 0 Then
    Set objH3 = objResultDiv.GetElementsByTagname("H3")(i)
    Set link = objH3.GetElementsByTagname("a")(0)

'get thumbnail image location
    Cells(ActiveCell.Row + i, 1).Value = objResultDiv.GetElementsByTagname("img")(i).src
'get news title    
    Cells(ActiveCell.Row + i, 2).Value = objH3.InnerText
'get news link
    Cells(ActiveCell.Row + i, 3).Value = link.href
'get source name
    Cells(ActiveCell.Row + i, 5).Value = "need help"
'get source time
    Cells(ActiveCell.Row + i, 6).Value = "need help"
'get news paragraph
    Cells(ActiveCell.Row + i, 7).Value = "need help"

End If
DoEvents
Next i

html.Close

End Sub

我能够返回以下对象:

在此处输入图像描述

我知道我想要获取的红色对象在哪里,我只是在使用时遇到语法问题GetElementsByClassName在此处输入图像描述

例如,我知道文本“ZDNet”位于:

?...GetElementsByClassName("slp")(i).GetElementsByTagname("span")(0).InnerText

而日期“2017 年 1 月 7 日”位于:

?...GetElementsByClassName("slp")(i).GetElementsByTagname("span")(2).InnerText

但我无法获得正确的语法。

我希望我犯了一个非常简单的错误,但如果它们更有效,我也愿意接受其他方法。

感谢阅读,J先生


解决方案


暂无回答




所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接:http://www.qianduanheidong.com/blog/article/336679/eaca31d6d626274b9287/

来源:前端黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

25 0
收藏该文
已收藏

评论内容:(最多支持255个字符)