︠c3470d05-3f1c-4605-997e-074d194681dfi︠
%md
# Фиктивные переменные
︡cd97effc-6f64-4ddb-8bc8-27907870ed7a︡{"done":true,"md":"# Фиктивные переменные"}
︠14f9e48d-ee0f-4be1-85c1-383924d3e350s︠
f = open('apartment.tsv', 'r')
s = f.read().replace(',', '.')
f.close()
fnew = open('ap.tsv', 'w')
fnew.write(s)
fnew.close()
︡34dde7d7-01b6-4dc0-8305-975c4bbc0d15︡{"done":true}︡{"done":true}
︠4f67668c-fdc3-4637-9d7f-74ed2d0965d3s︠
%r
ap <- read.table('ap.tsv', header=TRUE, sep='\t')
str(ap)
︡b0bf1cbd-ae72-4d9f-aa49-0ff1ab4ad131︡{"stdout":"'data.frame':\t100 obs. of  10 variables:\n $ X : int  1 2 3 4 5 6 7 8 9 10 ...\n $ Y : num  15.9 27 21.1 24.5 13.5 22.5 15.5 75.9 15.1 26 ...\n $ X1: int  1 3 2 4 1 2 3 4 1 2 ...\n $ X2: Factor w/ 4 levels \"К\",\"М\",\"П\",\"С\": 4 1 4 4 1 1 4 3 1 1 ...\n $ X3: num  39 68.4 54.7 90 34.8 48 68.1 132 39 55.5 ...\n $ X4: num  20 40.5 28 64 16 29 44.4 89.6 20 35 ...\n $ X5: num  8.2 10.7 10.7 15 10.7 8 7.2 11 8.5 8 ...\n $ X6: int  0 0 0 0 0 1 0 1 0 0 ...\n $ X7: int  1 1 1 0 0 1 0 1 1 1 ...\n $ X8: Factor w/ 2 levels \"В\",\"Н\": 2 2 2 1 2 1 1 2 2 1 ...\n"}︡{"done":true}︡
︠d1a5f9ba-e692-4a91-bce1-64187ae88ad2s︠
%r
X8.f <- factor(ap$X8)
dummy8 <- model.matrix(~X8.f)
dummy8
︡7bf8c847-0383-4f85-a9c3-b05ab7b7ddde︡{"html":"<table>\n<thead><tr><th></th><th scope=col>(Intercept)</th><th scope=col>X8.fН</th></tr></thead>\n<tbody>\n\t<tr><th scope=row>1</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>2</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>3</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>4</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>5</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>6</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>7</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>8</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>9</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>10</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>11</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>12</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>13</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>14</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>15</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>16</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>17</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>18</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>19</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>20</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>21</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>22</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>23</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>24</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>25</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>26</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>27</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>28</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>29</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>30</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>⋮</th><td>⋮</td><td>⋮</td></tr>\n\t<tr><th scope=row>71</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>72</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>73</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>74</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>75</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>76</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>77</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>78</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>79</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>80</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>81</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>82</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>83</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>84</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>85</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>86</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>87</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>88</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>89</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>90</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>91</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>92</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>93</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>94</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>95</th><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>96</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>97</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>98</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>99</th><td>1</td><td>1</td></tr>\n\t<tr><th scope=row>100</th><td>1</td><td>0</td></tr>\n</tbody>\n</table>\n"}︡{"done":true}︡
︠4144f3b0-ff45-45ec-bf01-3ee87bb29c59s︠
%r
X2.f <- factor(ap$X2)
dummy2 <- model.matrix(~X2.f)
dummy2
︡170a2808-c799-497c-9fd5-99ddc1a8c9ca︡{"html":"<table>\n<thead><tr><th></th><th scope=col>(Intercept)</th><th scope=col>X2.fМ</th><th scope=col>X2.fП</th><th scope=col>X2.fС</th></tr></thead>\n<tbody>\n\t<tr><th scope=row>1</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>2</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>3</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>4</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>5</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>6</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>7</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>8</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>9</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>10</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>11</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>12</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>13</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>14</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>15</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>16</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>17</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>18</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>19</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>20</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>21</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>22</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>23</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>24</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>25</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>26</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>27</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>28</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>29</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>30</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>⋮</th><td>⋮</td><td>⋮</td><td>⋮</td><td>⋮</td></tr>\n\t<tr><th scope=row>71</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>72</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>73</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>74</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>75</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>76</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>77</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>78</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>79</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>80</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>81</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>82</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>83</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>84</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>85</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>86</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>87</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>88</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>89</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>90</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>91</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>92</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>93</th><td>1</td><td>0</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>94</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>95</th><td>1</td><td>0</td><td>0</td><td>1</td></tr>\n\t<tr><th scope=row>96</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>97</th><td>1</td><td>0</td><td>1</td><td>0</td></tr>\n\t<tr><th scope=row>98</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>99</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n\t<tr><th scope=row>100</th><td>1</td><td>1</td><td>0</td><td>0</td></tr>\n</tbody>\n</table>\n"}︡{"done":true}︡
︠80650797-eb7a-459c-a75a-4688f1d7ed89s︠
%r
ap.lm <- lm(ap$Y ~ ap$X1 + ap$X3 + ap$X4 + ap$X5 + dummy8[,2])
summary(ap.lm)
︡d7d754a1-3bc6-4ed5-882a-f0ffd857db23︡{"stdout":"\nCall:\nlm(formula = ap$Y ~ ap$X1 + ap$X3 + ap$X4 + ap$X5 + dummy8[, \n    2])\n\nResiduals:\n     Min       1Q   Median       3Q      Max \n-12.1940  -4.0914   0.2285   3.0462  15.8874 \n\nCoefficients:\n            Estimate Std. Error t value Pr(>|t|)    \n(Intercept)  -2.8049     1.8582  -1.509   0.1345    \nap$X1        -1.9545     1.0562  -1.850   0.0674 .  \nap$X3         0.6377     0.1201   5.308 7.38e-07 ***\nap$X4        -0.1911     0.1493  -1.280   0.2038    \nap$X5        -0.3848     0.1973  -1.951   0.0541 .  \ndummy8[, 2]   8.2635     1.2797   6.457 4.65e-09 ***\n---\nSignif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1\n\nResidual standard error: 5.633 on 94 degrees of freedom\nMultiple R-squared:  0.8406,\tAdjusted R-squared:  0.8321 \nF-statistic: 99.13 on 5 and 94 DF,  p-value: < 2.2e-16\n"}︡{"done":true}︡
︠000ebdba-ea0e-424f-8f35-9e99723f36c4︠











Collaborative Calculation and Data Science

colby

sagemath

Фиктивные переменные

Product

Resources

Company

	(Intercept)	X8.fН
1	1	1
2	1	1
3	1	1
4	1	0
5	1	1
6	1	0
7	1	0
8	1	1
9	1	1
10	1	0
11	1	0
12	1	0
13	1	1
14	1	0
15	1	1
16	1	1
17	1	0
18	1	1
19	1	1
20	1	1
21	1	0
22	1	0
23	1	1
24	1	1
25	1	1
26	1	0
27	1	0
28	1	0
29	1	1
30	1	1
⋮	⋮	⋮
71	1	1
72	1	0
73	1	0
74	1	0
75	1	1
76	1	1
77	1	1
78	1	0
79	1	0
80	1	1
81	1	0
82	1	0
83	1	0
84	1	1
85	1	1
86	1	1
87	1	0
88	1	0
89	1	0
90	1	1
91	1	1
92	1	1
93	1	0
94	1	0
95	1	0
96	1	1
97	1	1
98	1	1
99	1	1
100	1	0

	(Intercept)	X2.fМ	X2.fП	X2.fС
1	1	0	0	1
2	1	0	0	0
3	1	0	0	1
4	1	0	0	1
5	1	0	0	0
6	1	0	0	0
7	1	0	0	1
8	1	0	1	0
9	1	0	0	0
10	1	0	0	0
11	1	0	1	0
12	1	0	0	0
13	1	0	0	0
14	1	1	0	0
15	1	1	0	0
16	1	0	0	1
17	1	1	0	0
18	1	0	0	0
19	1	0	1	0
20	1	1	0	0
21	1	0	0	1
22	1	0	0	0
23	1	0	1	0
24	1	0	1	0
25	1	0	1	0
26	1	1	0	0
27	1	0	1	0
28	1	0	0	0
29	1	0	0	1
30	1	0	1	0
⋮	⋮	⋮	⋮	⋮
71	1	0	0	1
72	1	1	0	0
73	1	1	0	0
74	1	0	1	0
75	1	1	0	0
76	1	0	1	0
77	1	0	1	0
78	1	0	0	1
79	1	0	0	1
80	1	0	0	0
81	1	0	1	0
82	1	0	0	1
83	1	0	0	1
84	1	1	0	0
85	1	1	0	0
86	1	0	1	0
87	1	1	0	0
88	1	0	0	1
89	1	0	0	1
90	1	0	1	0
91	1	1	0	0
92	1	0	1	0
93	1	0	0	0
94	1	0	0	1
95	1	0	0	1
96	1	1	0	0
97	1	0	1	0
98	1	1	0	0
99	1	1	0	0
100	1	1	0	0

	(Intercept)	X8.fН
1	1	1
2	1	1
3	1	1
4	1	0
5	1	1
6	1	0
7	1	0
8	1	1
9	1	1
10	1	0
11	1	0
12	1	0
13	1	1
14	1	0
15	1	1
16	1	1
17	1	0
18	1	1
19	1	1
20	1	1
21	1	0
22	1	0
23	1	1
24	1	1
25	1	1
26	1	0
27	1	0
28	1	0
29	1	1
30	1	1
⋮	⋮	⋮
71	1	1
72	1	0
73	1	0
74	1	0
75	1	1
76	1	1
77	1	1
78	1	0
79	1	0
80	1	1
81	1	0
82	1	0
83	1	0
84	1	1
85	1	1
86	1	1
87	1	0
88	1	0
89	1	0
90	1	1
91	1	1
92	1	1
93	1	0
94	1	0
95	1	0
96	1	1
97	1	1
98	1	1
99	1	1
100	1	0

	(Intercept)	X2.fМ	X2.fП	X2.fС
1	1	0	0	1
2	1	0	0	0
3	1	0	0	1
4	1	0	0	1
5	1	0	0	0
6	1	0	0	0
7	1	0	0	1
8	1	0	1	0
9	1	0	0	0
10	1	0	0	0
11	1	0	1	0
12	1	0	0	0
13	1	0	0	0
14	1	1	0	0
15	1	1	0	0
16	1	0	0	1
17	1	1	0	0
18	1	0	0	0
19	1	0	1	0
20	1	1	0	0
21	1	0	0	1
22	1	0	0	0
23	1	0	1	0
24	1	0	1	0
25	1	0	1	0
26	1	1	0	0
27	1	0	1	0
28	1	0	0	0
29	1	0	0	1
30	1	0	1	0
⋮	⋮	⋮	⋮	⋮
71	1	0	0	1
72	1	1	0	0
73	1	1	0	0
74	1	0	1	0
75	1	1	0	0
76	1	0	1	0
77	1	0	1	0
78	1	0	0	1
79	1	0	0	1
80	1	0	0	0
81	1	0	1	0
82	1	0	0	1
83	1	0	0	1
84	1	1	0	0
85	1	1	0	0
86	1	0	1	0
87	1	1	0	0
88	1	0	0	1
89	1	0	0	1
90	1	0	1	0
91	1	1	0	0
92	1	0	1	0
93	1	0	0	0
94	1	0	0	1
95	1	0	0	1
96	1	1	0	0
97	1	0	1	0
98	1	1	0	0
99	1	1	0	0
100	1	1	0	0

	(Intercept)	X8.fН
1	1	1
2	1	1
3	1	1
4	1	0
5	1	1
6	1	0
7	1	0
8	1	1
9	1	1
10	1	0
11	1	0
12	1	0
13	1	1
14	1	0
15	1	1
16	1	1
17	1	0
18	1	1
19	1	1
20	1	1
21	1	0
22	1	0
23	1	1
24	1	1
25	1	1
26	1	0
27	1	0
28	1	0
29	1	1
30	1	1
⋮	⋮	⋮
71	1	1
72	1	0
73	1	0
74	1	0
75	1	1
76	1	1
77	1	1
78	1	0
79	1	0
80	1	1
81	1	0
82	1	0
83	1	0
84	1	1
85	1	1
86	1	1
87	1	0
88	1	0
89	1	0
90	1	1
91	1	1
92	1	1
93	1	0
94	1	0
95	1	0
96	1	1
97	1	1
98	1	1
99	1	1
100	1	0

	(Intercept)	X2.fМ	X2.fП	X2.fС
1	1	0	0	1
2	1	0	0	0
3	1	0	0	1
4	1	0	0	1
5	1	0	0	0
6	1	0	0	0
7	1	0	0	1
8	1	0	1	0
9	1	0	0	0
10	1	0	0	0
11	1	0	1	0
12	1	0	0	0
13	1	0	0	0
14	1	1	0	0
15	1	1	0	0
16	1	0	0	1
17	1	1	0	0
18	1	0	0	0
19	1	0	1	0
20	1	1	0	0
21	1	0	0	1
22	1	0	0	0
23	1	0	1	0
24	1	0	1	0
25	1	0	1	0
26	1	1	0	0
27	1	0	1	0
28	1	0	0	0
29	1	0	0	1
30	1	0	1	0
⋮	⋮	⋮	⋮	⋮
71	1	0	0	1
72	1	1	0	0
73	1	1	0	0
74	1	0	1	0
75	1	1	0	0
76	1	0	1	0
77	1	0	1	0
78	1	0	0	1
79	1	0	0	1
80	1	0	0	0
81	1	0	1	0
82	1	0	0	1
83	1	0	0	1
84	1	1	0	0
85	1	1	0	0
86	1	0	1	0
87	1	1	0	0
88	1	0	0	1
89	1	0	0	1
90	1	0	1	0
91	1	1	0	0
92	1	0	1	0
93	1	0	0	0
94	1	0	0	1
95	1	0	0	1
96	1	1	0	0
97	1	0	1	0
98	1	1	0	0
99	1	1	0	0
100	1	1	0	0