pr3/python/data_mining/data_mining.ipynb

123 lines
5.0 KiB
Plaintext

{
"cells": [
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
" X year month measure X1 X2 X3 X4 X5 X6 ... \\\n",
"0 1 2014 12 Max.TemperatureF 64 42 51 43 42 45 ... \n",
"1 2 2014 12 Mean.TemperatureF 52 38 44 37 34 42 ... \n",
"2 3 2014 12 Min.TemperatureF 39 33 37 30 26 38 ... \n",
"3 4 2014 12 Max.Dew.PointF 46 40 49 24 37 45 ... \n",
"4 5 2014 12 MeanDew.PointF 40 27 42 21 25 40 ... \n",
".. ... ... ... ... ... ... ... ... ... ... ... \n",
"281 282 2015 12 Max.Gust.SpeedMPH 17 NaN NaN NaN NaN NaN ... \n",
"282 283 2015 12 PrecipitationIn 0.14 NaN NaN NaN NaN NaN ... \n",
"283 284 2015 12 CloudCover 7 NaN NaN NaN NaN NaN ... \n",
"284 285 2015 12 Events Rain NaN NaN NaN NaN NaN ... \n",
"285 286 2015 12 WindDirDegrees 109 NaN NaN NaN NaN NaN ... \n",
"\n",
" X22 X23 X24 X25 X26 X27 X28 X29 X30 X31 \n",
"0 44 47 46 59 50 52 52 41 30 30 \n",
"1 39 45 44 52 44 45 46 36 26 25 \n",
"2 33 42 41 44 37 38 40 30 22 20 \n",
"3 39 45 46 58 31 34 42 26 10 8 \n",
"4 34 42 44 43 29 31 35 20 4 5 \n",
".. ... ... ... ... ... ... ... ... ... ... \n",
"281 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"282 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"283 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"284 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"285 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"\n",
"[286 rows x 35 columns]\n"
]
}
],
"source": [
"import pandas as pd\n",
"import pyreadr\n",
"import matplotlib as plt\n",
"\n",
"df = pyreadr.read_r(\"weather.rds\")[None]\n",
"\n",
"print(df)"
]
},
{
"cell_type": "code",
"execution_count": 31,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
" year month measure X1 X2 X3 X4 X5 X6 X7 ... \\\n",
"0 2014 12 Max.TemperatureF 64 42 51 43 42 45 38 ... \n",
"1 2014 12 Mean.TemperatureF 52 38 44 37 34 42 30 ... \n",
"2 2014 12 Min.TemperatureF 39 33 37 30 26 38 21 ... \n",
"3 2014 12 Max.Dew.PointF 46 40 49 24 37 45 36 ... \n",
"4 2014 12 MeanDew.PointF 40 27 42 21 25 40 20 ... \n",
".. ... ... ... ... ... ... ... ... ... ... ... \n",
"281 2015 12 Max.Gust.SpeedMPH 17 NaN NaN NaN NaN NaN NaN ... \n",
"282 2015 12 PrecipitationIn 0.14 NaN NaN NaN NaN NaN NaN ... \n",
"283 2015 12 CloudCover 7 NaN NaN NaN NaN NaN NaN ... \n",
"284 2015 12 Events Rain NaN NaN NaN NaN NaN NaN ... \n",
"285 2015 12 WindDirDegrees 109 NaN NaN NaN NaN NaN NaN ... \n",
"\n",
" X22 X23 X24 X25 X26 X27 X28 X29 X30 X31 \n",
"0 44 47 46 59 50 52 52 41 30 30 \n",
"1 39 45 44 52 44 45 46 36 26 25 \n",
"2 33 42 41 44 37 38 40 30 22 20 \n",
"3 39 45 46 58 31 34 42 26 10 8 \n",
"4 34 42 44 43 29 31 35 20 4 5 \n",
".. ... ... ... ... ... ... ... ... ... ... \n",
"281 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"282 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"283 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"284 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"285 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n",
"\n",
"[286 rows x 34 columns]\n"
]
}
],
"source": [
"df = pyreadr.read_r(\"weather.rds\")[None]\n",
"\n",
"df : pd.DataFrame = df.drop([\"X\"], axis=1)\n",
"\n",
"print(df)"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.11.3"
},
"orig_nbformat": 4
},
"nbformat": 4,
"nbformat_minor": 2
}