C++libcurl-无法从URL检索整个html内容

2022-11-29 C/C++问题得得之家

C++ libcurl - Can#39;t retrieve whole html content from URL(C++libcurl-无法从URL检索整个html内容)

本文介绍了C++libcurl-无法从URL检索整个html内容的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

使用C++和libcurl库，我试图以这种方式从该网站https://www.nutritionix.com/food/Banana获取完整的HTML：

int main(){
   std::string content;
   curl_global_init(CURL_GLOBAL_ALL);
   CURL *curl = nullptr;
   curl = curl_easy_init();
   if (curl) {
       curl_easy_setopt(curl, CURLOPT_URL, "https://www.nutritionix.com/food/Banana" );
       curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);
       curl_easy_setopt(curl, CURLOPT_WRITEDATA, &content);
       curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, writer);
       CURLcode code = curl_easy_perform(curl);
       curl_easy_cleanup(curl);
   }
   curl_global_cleanup();
   std::cout << content << std::endl;
   system("pause");
}

writer函数定义如下：

static int writer(char *data, size_t size, size_t nmemb, std::string *writerData) {
   if (writerData == NULL)
       return 0;
   writerData->append(data, size*nmemb);
   return size * nmemb;
}

通过这种方式，我可以只获得几个HTML代码，但如何检索完整的HTML内容以在稍后阶段对其进行分析？

推荐答案

您不能这样说，或者更好地说：您拥有网站调用的全部html内容。

在现代网站上，一个简单的http请求只会返回一些带有一些脚本和元数据的70字符长的响应。脚本在加载时执行，然后将填充页面内容。

亲自尝试

访问https://www.nutritionix.com/food/Banana
Ctrl+Shift+I
转到网络选项卡并重新加载页面
单击列表中名为"Banana"的第一项
单击右侧的"响应"

这是执行上述代码后字符串包含的内容

这篇关于C++libcurl-无法从URL检索整个html内容的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持编程学习网！

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除！

上一篇：导致堆栈溢出的巨型数组下一篇：WxWidget-在按钮单击时隐藏/显示`boxsizer`的内容

相关文档推荐

Boost模块计算机类型&#39；x86&#39；与目标计算机类型&#39；x64&#39；

Boost module machine type #39;X86#39; conflicts with target machine type #39;x64#39;(Boost模块计算机类型#39；x86#39；与目标计算机类型#39；x64#39；)

运行LLVM示例时出现问题

Trouble running LLVM examples(运行LLVM示例时出现问题)

链接某些Windows API时出现链接器错误

Linker error while linking some windows APIs(链接某些Windows API时出现链接器错误)

Python ctype，C++对象销毁

Python ctypes, C++ object destruction(Python ctype，C++对象销毁)

DllGetClassObject返回&amp；不支持这样的接口，而CoCreateInstance发现它成功了

DllGetClassObject return amp;quot;No such interface supportedamp;quot; while CoCreateInstance can find it successful(DllGetClassObject返回amp；不支持这样的接口，而CoCreateInstance发现它成功了)

Static_cast&amp；lt；double&amp；gt；(std：：nanf(&amp；quot；&amp；quot；))是否定义良好？

Is static_castamp;lt;doubleamp;gt;(std::nanf(amp;quot;amp;quot;)) well defined?(Static_castamp；lt；doubleamp；gt；(std：：nanf(amp；quot；amp；quot；))是否定义良好？)

栏目导航

前端问题 php问题 Java问题 Python问题 C/C++问题 C#/.NET问题移动开发问题数据库问题

最新文章

热门文章

热门标签

html vue validate adobe dreamweaver hbuilder vscode aptana editor dedecms ckeditor 编辑器过滤规则织梦图片本地化模板缩略图图集图片删除 ajax 瀑布流无限下拉 cms 判断 sql 清除 tag 文档数 angularjs2 按钮切换效果 vue3 thinkphp yii2 css 项目列表 li go Beego Buffalo Echo Gin Iris Revel 百度云虚拟主机 pbootcms 伪静态框架排序数据库对象字段 sql语句 php 字符串分割 D3.js bootstrap 函数 svg selectAll 织梦cms 关键词解析采集长度限制日期正则表达式