C++libcurl-无法从URL检索整个html内容

C++ libcurl - Can#39;t retrieve whole html content from URL(C++libcurl-无法从URL检索整个html内容)
本文介绍了C++libcurl-无法从URL检索整个html内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

使用C++libcurl库,我试图以这种方式从该网站https://www.nutritionix.com/food/Banana获取完整的HTML:

int main(){
   std::string content;
   curl_global_init(CURL_GLOBAL_ALL);
   CURL *curl = nullptr;
   curl = curl_easy_init();
   if (curl) {
       curl_easy_setopt(curl, CURLOPT_URL, "https://www.nutritionix.com/food/Banana" );
       curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);
       curl_easy_setopt(curl, CURLOPT_WRITEDATA, &content);
       curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, writer);
       CURLcode code = curl_easy_perform(curl);
       curl_easy_cleanup(curl);
   }
   curl_global_cleanup();
   std::cout << content << std::endl;
   system("pause");
}

writer函数定义如下:

static int writer(char *data, size_t size, size_t nmemb, std::string *writerData) {
   if (writerData == NULL)
       return 0;
   writerData->append(data, size*nmemb);
   return size * nmemb;
}

通过这种方式,我可以只获得几个HTML代码,但如何检索完整的HTML内容以在稍后阶段对其进行分析?

推荐答案

您不能这样说,或者更好地说:您拥有网站调用的全部html内容。

在现代网站上,一个简单的http请求只会返回一些带有一些脚本和元数据的70字符长的响应。脚本在加载时执行,然后将填充页面内容。

亲自尝试

  • 访问https://www.nutritionix.com/food/Banana
  • Ctrl+Shift+I
  • 转到网络选项卡并重新加载页面
  • 单击列表中名为"Banana"的第一项
  • 单击右侧的"响应"

这是执行上述代码后字符串包含的内容

这篇关于C++libcurl-无法从URL检索整个html内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

Boost module machine type #39;X86#39; conflicts with target machine type #39;x64#39;(Boost模块计算机类型#39;x86#39;与目标计算机类型#39;x64#39;)
Trouble running LLVM examples(运行LLVM示例时出现问题)
Linker error while linking some windows APIs(链接某些Windows API时出现链接器错误)
Python ctypes, C++ object destruction(Python ctype,C++对象销毁)
DllGetClassObject return amp;quot;No such interface supportedamp;quot; while CoCreateInstance can find it successful(DllGetClassObject返回amp;不支持这样的接口,而CoCreateInstance发现它成功了)
Is static_castamp;lt;doubleamp;gt;(std::nanf(amp;quot;amp;quot;)) well defined?(Static_castamp;lt;doubleamp;gt;(std::nanf(amp;quot;amp;quot;))是否定义良好?)