使用libcurl进行文件上传

时间:2022-05-31 07:55:32

上篇博文讲到了如何使用multicurl来进行http并发访问,今天继续有关curl的主题,来八一八如何使用curl来上传文件,在介绍具体方法之前了解下目前http文件上传的基本实现。

rfc1867描述了如何使用http协议来上传客户端文件,目前基本上所有的浏览器和web服务器都支持http文件上传,它的使用也十分的简单,具体的来说就是在页面上创建一个form表单,表单的enctype属性为multipart/form-data,action为接收上传文件的cgi url,请求方式为post,在表单中添加type属性为file的input,file input里面选择需要上传的文件,选择好后点击submit,服务器端收到multipart post请求后,会根据相关协议解析请求,然后保存上传的文件内容,Multipart表单示例:

  1. <form enctype="multipart/form-data" action="http://host:port/UploadFile" method=post>
  2. Upload :<br>
  3. <input name="userfile" type="file"><br>
  4. text field :<input type="text" name="text" value="text"><br>
  5. <input type="submit" value="提交"><input type=reset>
  6. </form>

好了,现在来讲一讲curl的文件上传,对于curl来讲,其实它要完成的任务就是构建一个multipart/formdata HTTP POST请求。类似于往multipart form表单中添加type为file或者text的input item一样,curl也需要我们构造表单中的input item,curl_formadd函数可以帮助我们完成这个任务,它即可以添加普通的name-value section,也可以添加file upload section,下面举几个具体例子:

1、添加name/content section

  1. curl_formadd(&post, &last, CURLFORM_COPYNAME, "name",   CURLFORM_COPYCONTENTS, "content", CURLFORM_END);

2、添加name/content/contenttype section

  1. curl_formadd(&post, &last, CURLFORM_COPYNAME, "name",   CURLFORM_COPYCONTENTS, "content",   CURLFORM_CONTENTTYPE, "type", CURLFORM_END);

3、添加 file/filename section

  1. curl_formadd(&post, &last, CURLFORM_COPYNAME, "pic",   CURLFORM_FILE, "demo.jpg", CURLFORM_FILENAME, "upload.pic", CURLFORM_END);

4、添加file/contenttype section

  1. curl_formadd(&post, &last, CURLFORM_COPYNAME, "pic",   CURLFORM_FILE, "demo.jpg", CURLFORM_FILENAME, "upload.pic",  CURLFORM_CONTENTTYPE, "image/jpeg", CURLFORM_END);

上面的post 和 last都是指向curl_httppost对象的指针, post指向的就是一个由所有section组成的链表的开端,last是该链表的尾指针。当我们添加完所有的form section之后,使用curl_easy_setopt(curl, CURLOPT_HTTPPOST,post)函数设置curl的http post,最后就是调用curl_easy_perform执行请求。需要注意的是,当使用libcurl的POST方式时,如果POST数据的大小大于1024个字节,libcurl不会直接发送POST请求,而是会分为两步执行请求:
    1、发送一个请求,该请求头部包含一个Expect: 100-continue的字段,用来询问server是否愿意接受数据
    2、当接收到从server返回的100-continue的应答后,它才会真正的发起POST请求,将数据发送给server。
    对于文件上传来说,文件大小往往会超过1024个字节,所以如果你确认你的服务器不会拒绝你的文件上传请求的话,可以禁止curl的Expect请求头,具体方法可以去看看我的另外一篇文章《libcurl的使用问题“Expect100-continue” 》。

最后附上curl官网上提供的文件上传例子:

    1. /* This is an example application source code using the multi interface
    2. * to do a multipart formpost without "blocking". */
    3. #include <stdio.h>
    4. #include <string.h>
    5. #include <sys/time.h>
    6. #include <curl/curl.h>
    7. int main(void)
    8. {
    9. CURL *curl;
    10. CURLM *multi_handle;
    11. int still_running;
    12. struct curl_httppost *formpost=NULL;
    13. struct curl_httppost *lastptr=NULL;
    14. struct curl_slist *headerlist=NULL;
    15. static const char buf[] = "Expect:";
    16. /* Fill in the file upload field. This makes libcurl load data from
    17. the given file name when curl_easy_perform() is called. */
    18. curl_formadd(&formpost,
    19. &lastptr,
    20. CURLFORM_COPYNAME, "sendfile",
    21. CURLFORM_FILE, "postit2.c",
    22. CURLFORM_END);
    23. /* Fill in the filename field */
    24. curl_formadd(&formpost,
    25. &lastptr,
    26. CURLFORM_COPYNAME, "filename",
    27. CURLFORM_COPYCONTENTS, "postit2.c",
    28. CURLFORM_END);
    29. /* Fill in the submit field too, even if this is rarely needed */
    30. curl_formadd(&formpost,
    31. &lastptr,
    32. CURLFORM_COPYNAME, "submit",
    33. CURLFORM_COPYCONTENTS, "send",
    34. CURLFORM_END);
    35. curl = curl_easy_init();
    36. multi_handle = curl_multi_init();
    37. /* initalize custom header list (stating that Expect: 100-continue is not
    38. wanted */
    39. headerlist = curl_slist_append(headerlist, buf);
    40. if(curl && multi_handle) {
    41. /* what URL that receives this POST */
    42. curl_easy_setopt(curl, CURLOPT_URL, "http://www.example.com/upload.cgi");
    43. curl_easy_setopt(curl, CURLOPT_VERBOSE, 1L);
    44. curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headerlist);
    45. curl_easy_setopt(curl, CURLOPT_HTTPPOST, formpost);
    46. curl_multi_add_handle(multi_handle, curl);
    47. curl_multi_perform(multi_handle, &still_running);
    48. do {
    49. struct timeval timeout;
    50. int rc; /* select() return code */
    51. fd_set fdread;
    52. fd_set fdwrite;
    53. fd_set fdexcep;
    54. int maxfd = -1;
    55. long curl_timeo = -1;
    56. FD_ZERO(&fdread);
    57. FD_ZERO(&fdwrite);
    58. FD_ZERO(&fdexcep);
    59. /* set a suitable timeout to play around with */
    60. timeout.tv_sec = 1;
    61. timeout.tv_usec = 0;
    62. curl_multi_timeout(multi_handle, &curl_timeo);
    63. if(curl_timeo >= 0) {
    64. timeout.tv_sec = curl_timeo / 1000;
    65. if(timeout.tv_sec > 1)
    66. timeout.tv_sec = 1;
    67. else
    68. timeout.tv_usec = (curl_timeo % 1000) * 1000;
    69. }
    70. /* get file descriptors from the transfers */
    71. curl_multi_fdset(multi_handle, &fdread, &fdwrite, &fdexcep, &maxfd);
    72. /* In a real-world program you OF COURSE check the return code of the
    73. function calls.  On success, the value of maxfd is guaranteed to be
    74. greater or equal than -1.  We call select(maxfd + 1, ...), specially in
    75. case of (maxfd == -1), we call select(0, ...), which is basically equal
    76. to sleep. */
    77. rc = select(maxfd+1, &fdread, &fdwrite, &fdexcep, &timeout);
    78. switch(rc) {
    79. case -1:
    80. /* select error */
    81. break;
    82. case 0:
    83. default:
    84. /* timeout or readable/writable sockets */
    85. printf("perform!\n");
    86. curl_multi_perform(multi_handle, &still_running);
    87. printf("running: %d!\n", still_running);
    88. break;
    89. }
    90. } while(still_running);
    91. curl_multi_cleanup(multi_handle);
    92. /* always cleanup */
    93. curl_easy_cleanup(curl);
    94. /* then cleanup the formpost chain */
    95. curl_formfree(formpost);
    96. /* free slist */
    97. curl_slist_free_all (headerlist);
    98. }
    99. return 0;
    100. }