如何在 stata 或 r 中拟合具有多水平自变量的多项式逻辑回归模型

How to fit Multinomial logistic regression model with multilevel independent variables in stata or r

提问人:Sorath Abbasi 提问时间:10/30/2023 更新时间:11/14/2023 访问量:49

问:

我有旅行数据,包括一个人选择特定的交通方式(例如,汽车)而不是其他选择(例如,公共汽车、飞机和火车),并为他旅行的距离支付一定的价格。每一行代表该用户在所选模式下进行的行程。 宽格式的数据如下所示:

* Define variables and add data input str15 Mode Mode_id Price Distance Car 1 4.5 109 Train 2 2.1 34 Bus 3 3.3 14 Plain 4 8 150 Car 1 5 20 end * Display the dataset list

我加入了地区一级的另一组社会经济变量,更新后的数据如下所示:

* Define the dataset input str15 District District_id str10 Mode Mode_id Price Distance Income Praha 1 1 "Car" 1 4.5 109 200 Praha 1 1 "Train" 2 2.1 34 200 Praha 2 2 "Bus" 3 3.3 14 300 Praha 1 1 "Plain" 4 8 150 200 Praha 2 2 "Car" 1 5 20 300 end * Save the dataset save "Trips_Districts.dta", replace

现在,我想用替代的特定自变量“价格”和“距离”以及嵌套在第一级(即地区)的另一组自变量“收入”和“教育”来预测人们的选择偏好模式。

长格式的重塑数据如下所示:

* Define variable names and data input str10 District str10 District_id Person_id str10 Mode Choice Price Distance Income "Praha 1" 1 1 "Car" 1 4.5 109 200 "Praha 1" 1 1 "Train" 0 . 200 "Praha 1" 1 1 "Bus" 0 . 200 "Praha 1" 1 1 "Plane" 0 . 200 "Praha 1" 1 2 "Train" 1 2.1 34 200 "Praha 1" 1 2 "Car" 0 . 200 "Praha 1" 1 2 "Bus" 0 . 200 "Praha 1" 1 2 "Plane" 0 . 200 "Praha 2" 2 3 "Bus" 1 3.3 14 300 "Praha 2" 2 3 "Plane" 0 . 300 "Praha 2" 2 3 "Car" 0 . 300 "Praha 2" 2 3 "Train" 0 . 300 "Praha1" 1 4 "Plane" 1 8 150 200 "Praha1" 1 4 "Car" 0 . 200 "Praha1" 1 4 "Train" 0 . 200 "Praha1" 1 4 "Bus" 0 . 200 "Praha 2" 1 5 "Car" 1 20 21 300 "Praha 2" 1 5 "Train" 0 . 300 "Praha 2" 1 5 "Bus" 0 . 300 "Praha 2" 1 5 "Plane" 0 . 300 end * Save the dataset save "Trips_Districts_Final.dta", replace

问题 1 : 除了所选模式之外,我没有其他模式的价格和距离信息。

任何模型推荐和数据代码将我的宽数据重塑为 stata 或 r 的长格式将不胜感激。

先谢谢你。

R 逻辑回归多项 MLOGIT

评论


答:

1赞 Pablo Bernabeu 11/2/2023 #1

关于重塑为长格式,您最近在此处提供了解决方案。

关于分析,我在这里看不到足够的数据来创建任何统计模型。我认为您只能创建一些绘图(例如,使用 ggplot2)。