数学建模美赛(模型积累2)

这篇具有很好参考价值的文章主要介绍了数学建模美赛(模型积累2)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、聚类模型

SPSS聚类分析(含k-均值聚类,系统聚类和二阶聚类)https://blog.csdn.net/m0_52124992/article/details/128916757

看这个,写的很详细(๑•̀ㅂ•́)و✧

DBSCAN聚类:基于密度的方法的特点是不依赖于距离,而是依赖于密度,从而克服基于距离的算法只能发现“球形”聚簇的缺点

二、爬虫学习

(1)我选择的是在pycharm上进行爬虫

爬虫入门教程:【Python+爬虫】爆肝两个月!拜托三连了!这绝对是全B站最用心(没有之一)

(这个up讲课很可爱,PPT做的也很精美,超级好!)

还有一个教程我也很喜欢:【Python爬虫教程】

(2)方法积累

因为这里没写完就开始比赛了,现在这部分是比完赛补充的,

学完爬虫之后一定要找几个例子去练习,不只是多看几个有有教程的案例,要自己找信息去爬,毕竟有一句关于爬虫的名言就是万物皆可爬嘛 (๑•̀ㅂ•́)و✧

在练习的过程中,注意区分是从网页源代码中找信息,还是通过抓包找信息,这涉及到获取到的数据格式的不同。

1.直接爬取的网页源代码,“.text”之后获取到“str”字符串类型的数据,输出可以看到是<html>的数据(不是一整行),这样之后用正则去筛选所需要的信息是最简单的。要注意正则得到的结果是一个列表,哪怕只有一组数据。

2.通过抓包获取的数据包:

如果一眼看上去比较整齐(先在浏览器里预览数据包内容),这时候就不适合".text"转换成字符串了,选择",json()"可以得到更加整齐的数据,字典或者由字典组成的列表(判断是不是字典就看冒号前面的字符是不是单引号括起来的,如果是则是字典)。索引之后就是字符串类型了,如果需要可以继续用正则筛选;

还有一种情况,如果".text"得到的类似网页数据,但是在一整行内,且内容中充斥着 \n \t 等,这种数据用正则并不好处理,可以选择用",json()"获取到字典数据,进一步索引得到字符串,然后再使用正则筛选数据。

3.我的实战经验也并不多,只是在比赛过程中用到了这些,简单总结了一下方法规律,希望能帮到大家。在实际应用中还是要根据需要爬取的数据类型灵活的选择合适的方法。

(3)经验积累

在实际使用中,出现了几个棘手的问题

1.在爬取外国网站时,网站加载速度慢,如果需要的数据量大,运行时间就会特别长,可以准备一下多线程,可以大幅度提高爬取的速度。因为考虑到多线程会影响数据顺序,而且我需要的数据也并不是很多,所以我没有使用,具体代码上面教程里也有讲到。

#需要导库
from concurrent.futures import ThreadPoolExecutor

2.在循环爬取的过程中,可能会出现访问失败的情况,为了不影响整个进度,可以用try except语句解决

        try:
            #可能出问题的代码段
            #要设置timeout值(单位是秒)
            response = requests.get(url=url1, headers=headers, timeout=200)
            print('请求成功!!!')
        except requests.exceptions.ReadTimeout:
            print('请求超时,正在继续下一个循环。')
            continue  # 跳过当前循环,继续下一个循环
        except requests.exceptions.RequestException:
            print('请求异常,正在继续下一个循环。')
            continue  # 跳过当前循环,继续下一个循环

同时可以在循环中加入随机延时,以模拟真正的用户访问

import time
import random

time.sleep(random.random()*3)

3.爬取到的数据想要存储在Excel表格中,先把数据准备成二维列表数据

import pandas as pd

data = [['1', '21', '1954', '69', '1981', '0', '0', '2', '0', '43', '1974', '44', '1974'], 
        ['2', '13', '1974', '69', '1997', '0', '0', '2', '0', '67', '1955', 'T', '2011'], 
        ['3', '12', '1974', '69', '1997', '0', '0', '2', '0', '81', '2005', 'T', '2011'], 
        ['4', '14', '1970', '68', '2012', '0', '0', '2', '0', '74', '1995', '43', '1974']]

# 将数据转换为pandas DataFrame对象
df = pd.DataFrame(data, columns=None)

# 将DataFrame对象保存为Excel文件
df.to_excel("output.xlsx", index=False)

OK!今天就到这吧,也算是简单入门了爬虫,明天抽时间把MATLAB里面遇到的问题整理一下(如果有整理价值的话),今年美赛就这样了,静候佳音吧!!

over!睡觉!文章来源地址https://www.toymoban.com/news/detail-827685.html

到了这里,关于数学建模美赛(模型积累2)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 美赛BOOM数学建模4-2微分方程传染病预测模型

    注明:本文根据数学建模BOOM网课简单整理,自用 ❑从最简单的指数传播模型说起 • 不同类型传染病的发病机理和传播途径各有特点 • 有的传染病,在得过一次后可获得 免疫力 ,但有的则不会 • 有的传染病具有 潜伏期 ,有的则没有 • 需要对不同类型的传染病建立相应

    2024年02月08日
    浏览(36)
  • 【数学建模美赛】【LaTeX】论文模板

    在数学建模竞赛中,往往论文的版面与美观占一定的分数,而大多数都利用word排版,因为word排版简单方便,但在最后转pdf时会出现版面的错乱情况,所以这会影响最终的成绩。因此我们可以采用LaTeX进行论文的排版,使论文的版面更加自然。LaTeX排版需要一定的编程基础,这

    2024年02月11日
    浏览(38)
  • 数学建模美赛到底要注意什么?

    论文本质上是一种解答 页数限制是刚性! 假设要具有合理性,同时简化问题 ,比如:绕行星转的时候将行星看作球体,如果下落且行星很大,则下落时行星表面可视为平面地面。 先算出结果,判断是否能接受,接受的话再去保留原始假设。 假设的理由!!!假设的合理性

    2024年02月03日
    浏览(27)
  • 2023美赛ABCDEF题思路获取/2023美赛思路ABCDEF题/美赛数学建模思路

    美赛、数学建模、美国大学生数学建模、美赛思路、美国大学生数学建模思路、2023美赛、2023美国大学生数学建模竞赛、2023美赛思路、2023美赛数据、2023美赛A题、2023美赛B题、2023美赛C题、2023美赛D题、2023美赛E题、2023美赛F题、 2023美赛数据、2023美赛论文、2023美赛解析、2023美

    2024年02月13日
    浏览(28)
  • 数学建模美赛资料(赛题+获奖论文更新)

    数学建模美赛历年真题可以帮助我们了解比赛的出题思路,对建模比赛有一个大致的了解。 在备赛过程中,通过往年真题,我们可以了解考试的范围和重点,做到心中有数,可以有的放矢。 通过真题,我们可以感受到各个模型的应用范围和问题的难度,使我们在备赛过程中

    2024年01月19日
    浏览(37)
  • 美赛BOOM数学建模BOOM1-4多目标规划

    既要XXX,又要XXX ❑ 回顾:(非)线性规划都是一个目标函数,例如工业生产产品,追求最大化利润等等。 ❑ 例如:某工厂生产产品Ⅰ和产品Ⅱ,有关数据如下,若只追求最大化利润,得到模型: 现在设有 3个目标 : • 1.尽量使产品Ⅰ的产量不超过产品Ⅱ的产量; • 2.尽可能

    2024年02月16日
    浏览(27)
  • 数学建模美赛O奖、国赛国一队伍经验分享

    前言:本团队成员来自某985院校,均成功保研,有多次数学建模参赛经验,对数模有一定自己的理解和体会。本人有幸汇集了三支分别获2023美赛O奖、F奖、M奖、2022美赛F奖、国赛国一、国二的队伍经验,现整理成文章,供大家参考,内容将持续更新。 本博主参加数学建模赛事

    2024年02月08日
    浏览(48)
  • 【数学建模美赛M奖速成系列】数据可视化(二)

    上一篇文章为大家分享了 山脊图和气泡图 的绘图方法与代码,这里学姐为继续为大家分享 百分比堆叠线条图和火山图 ,包含 matlab和python的完整代码 ,需要完整代码的同学看文章最后,另外,如果没有美赛经验想要获奖,欢迎咨询哦~ 百分比堆叠线条图是一种数据可视化工

    2024年01月19日
    浏览(38)
  • 【数学建模美赛M奖速成系列】数据可视化方法(一)

    最近开始更新一个新的系列科研绘图,在同一个竞赛下,大家都近乎相同的解题思路下。之所以能出现一等二等三等奖的区别很大部分都在于结果的可视化,为了能更好地帮助大家进行可视化,近期将专门推出一个可视化板块,推出各种好看实用的可视化图形。 也称为Joy P

    2024年01月16日
    浏览(31)
  • 【数学建模美赛M奖速成系列】报名流程与论文的基本格式

    最近,请本科学校多次获得国奖的大四数模学弟来为大家分享一些美赛技巧,他曾获得数模比赛国奖,美赛M奖,并顺利保研某985,今年还将继续参加美赛。 主办单位:COMAP 报名时间:2023.07.06-2024.02.01 比赛时间:2024.02.02-2024.02.06 Outstanding美赛特等奖 Finalist美赛特等奖提名 Me

    2024年02月04日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包