statistics

如何计算几个目标的转化率的统计显着性？2019-12-02 03:59:07

我正在制作python / django拆分测试或a / b测试库供我自己使用.但是,我不知道如何计算我的测试是否具有统计意义.我不了解统计信息,因此我无法理解大多数Wikipedia文章或与此主题有关的网页,因此我正在寻求其他程序员的帮助. 我有4个选项的简单实验,并且有一些使用它的用户数据.每
python-熊猫：通过直方图结果索引数据2019-12-01 13:57:42

我正在尝试通过它们的概率为数据建立索引(以简单的直方图估算).目的是选择概率小于某个阈值的序列中的项目. 我有一系列整数值,例如： import pandas as pnd import numpy as np series = pnd.Series(np.random.poisson(5, size = 100)) 然后我像这样计算他们的直方图： tmp = {"
python-分组的熊猫DataFrames：如何将scipy.stats.sem应用于它们？2019-12-01 04:06:15

我知道我可以通过执行以下操作来应用numpy方法： dataList是DataFrames的列表(相同的列/行). testDF = (concat(dataList, axis=1, keys=range(len(dataList))) .swaplevel(0, 1, axis=1) .sortlevel(axis=1) .groupby(level=0, axis=1)) testDF.aggregate
Python-最小化卡方2019-11-22 02:06:12

我一直在尝试通过最小化卡方使线性模型适合一组应力/应变数据.不幸的是,使用下面的代码不能正确最小化chisqfunc函数.它在初始条件x0处找到最小值,这是不正确的.我浏览了scipy.optimize文档,并进行了测试,以尽量减少其他已正常运行的功能.您能否建议下面的代码修复方法,或者建议我
为何scipy.stats.mstats.pearsonr结果与scipy.stats.pearsonr不一致？2019-11-21 19:05:44

我期望对于scipy.stats.mstats.pearsonr的掩码数组输入结果将为scipy.stats.pearsonr的结果与输入数据的未掩码值相同,但是不会： from pylab import randn,rand from numpy import ma import scipy.stats # Normally distributed data with noise x=ma.masked_array(randn(10000),
似然比测试statsmodels2019-11-21 18:06:48

在统计模型中,普通最小二乘法已实施似然比检验 OLSResults.compare_lr_test(restricted) 对于广义线性模型(GLM),情况并非如此.我试图强行复制OLS实现： from scipy import stats llf_full = results.llf llf_restr = results_res.llf df_full = results.df_resid df_restr = re
在Python中使用P值进行F检验2019-11-20 20:57:36

R允许我们计算两个总体之间的F检验： > d1 = c(2.5579227634, 1.7774243136, 2.0025207896, 1.9518876366, 0.0, 4.1984191803, 5.6170403364, 0.0) > d2 = c(16.93800333, 23.2837045311, 1.2674791828, 1.0889208427, 1.0447584137, 0.8971380534, 0.0, 0.0) > var.test(d1,d2)
Python：带有2个样本的二维Kolmogorov-Smirnov2019-11-20 13:58:03

我有两个二维的数据集：(X1,Y1)和(X2,Y2).我希望能够计算KS测试统计量,以确定这两个数据集中的值是来自相同还是不同的分布.我之前使用过scipy.stats.ks_2samp,但这是比较一维中的两个数据集或两个样本的概率分布.但是,在这种情况下,我不拘泥于概率分布,而是两个样本的离散x和y值.在
CodeGo.net>如何获得执行多次bernoulli实验的详细结果(概率树)2019-11-11 19:16:24

假设以下实验：进行相同的bernoulli试验(成功概率为P)N次我需要以下信息：成功/失败的所有可能顺序及其发生的可能性. 范例：进行3次成功的概率为P = 40％的Bernouilli实验将产生以下结果(S为成功,F为失败)： FFF0.216 短纤0.144 自由软件基金会0.144 SSF0.096 FFS0.144 超级FS0.096 FSS0.0
人口均衡的分层随机抽样2019-11-10 19:06:50

考虑一个具有偏态类分布的人口,如 ErrorType Samples 1 XXXXXXXXXXXXXXX 2 XXXXXXXX 3 XX 4 XXX 5 XXXXXXXXXXXX 我想从40个样本中随机抽取20个,而不会减少参与人数较少的任何类别
python-使用pandas数据框和约束最小化距离(Knn)2019-11-08 10:59:17

我正在尝试第一次使用Scipy和Scipy最小化.我已经阅读了文档并看过一些YT教程,似乎每次我们都需要最小化一个变量时,我们都需要对当前问题进行数学表示. 就我而言,我有一个代表我的数据集的玩具示例.我有： >产品清单 >客户清单和关于他们是否购买产品的二进制答复>我正在尝试对客户
PHP和MySQL统计系统2019-11-05 23:15:13

例如,在拥有1.000.000行的大型数据库中,使用IP存储用户访问并计算唯一用户的最佳数据库模型是什么？ SELECT COUNT(DISTINCT ip) FROM visits 但是使用1.000.000不同的ip可能是一个缓慢的查询.缓存不会返回实数. 大型统计系统如何计算不重复造访？解决方法:拥有另一个仅具有IP列和UNI
基于MySQL和PHP的统计信息2019-11-05 14:31:31

我正在为一个问题而苦苦挣扎,希望你们中的一些人能够为我提供帮助. 对于包含许多操作的表,我得到了以下表结构.然后,我想制作一个生成一些统计信息的php脚本. +---------------+-------------+------+-----+-------------------+----------------+ | Field | Type
java-如何使用JDBC访问Oracle表统计信息,特别是NUM_ROWS和AVG_ROW_LEN？2019-11-02 14:00:34

是否可以使用JDBC访问Java应用程序中的Oracle表级统计信息？我对值NUM_ROWS和AVG_ROW_LEN特别感兴趣,目的是为查询估计最佳内存缓冲区大小和访存大小.解决方法:如果您不关心数据库独立性 SELECT num_rows, avg_row_len FROM all_tables WHERE owner = '<<owner of the table>>'
php函数get_browser有多可靠？2019-11-02 13:30:35

我正在尝试找到一种检测访客操作系统,浏览器等的好方法. 我发现PHP函数get_browser 而且我看到该功能可以检测Java,尽管该功能使用了用户代理进行检测,但是在安装了Java的VM UA上我没有看到任何提及Java的信息. 函数如何知道？解决方法:它与browscap.ini文件一样准确.该文件未与PHP捆
是否有用于训练对数线性模型的python软件包？2019-10-31 00:59:42

有谁知道python中是否有用于训练loglinear模型的现有软件包？我有一个包含2000个变量和1000条记录的数据集.我正在寻找使用对数线性模型来估计频率.解决方法:如果使用旧版本的SciPy(即0.10或更早版本),则可以使用scipy.maxentropy(在NLP中,MaxEnt =最大熵建模=对数线性模型).在发布0.
python-计算高斯的标准偏差2019-10-29 18:57:14

我有一个数字列表,将其与长度相对应可得出高斯.我想在这个高斯上计算标准偏差,但是我得到的值(使用np.std()函数)显然太小了(我得到的数值为0.00143…当它应该为8.234时……).我认为我一直在计算y轴而不是x轴的标准偏差(这是应该在标准偏差上进行的计算),但是我对如何执行此操作有
可以在Scipy中的Mann-Whitney U检验中指定替代假设吗？2019-10-29 09:56:22

我想计算x的单侧p值；使用scipy.stats.mannwhitneyu函数： u_value, p_value = scipy.stats.mannwhitneyu(x, y) 但是,没有地方可以指定替代假设.在R中,可以使用： wilcox.test(x,y,Alternative =’greater’). 有谁知道是否可以使用scipy或任何其他软件包在python中执行此操作？解决方法
python-创建具有左偏斜概率分布的随机数2019-10-29 09:55:24

我想随机选择一个介于1-100之间的数字,以使获得60-100的数字的概率高于1-59. 我想对数字1-100进行左偏分布.也就是说,它有一个长长的尾巴和一个峰. 大致情况： pers = np.arange(1,101,1) prob = <left-skewed distribution> number = np.random.choice(pers, 1, p=prob) 我不知道
python-一种对集合进行分区以从子集中获取最小方差总和的策略2019-10-29 00:56:35

问题是：我有一组数字,需要将其分为k个子集.我必须找到最佳的分区策略,以使每个子集的方差最小.没有子集可以为空(方差是标准偏差的平方.) k是大于0的整数.近似值可以是1e 7 到目前为止,这是我的解决方案,适用于一些示例,但并非总是如此： >按升序对样本(一组数字)进行排序.>计算两个
python-如何在scikit-learn中使用SGDRegressor2019-10-28 09:07:19

我试图弄清楚如何正确使用scikit-learn的SGDRegressor模型. 为了适合数据集,我需要调用一个函数fit(X,y),其中x是一个形状为(n_samples,n_features)的numpy数组,而y是一个长度为n_samples的1d numpy数组.我试图弄清楚y应该代表什么. 例如我的数据显示如下：我的特征是从1972年开始的
python-熊猫多个列中最常见的值2019-10-26 21:56:30

我有不规则列数的一系列数据,我需要使用pandas从跨多列的拆分部分中确定最常见的值.我的意思的一个例子是,如果我知道同事每天午餐吃的奶酪是什么： Idx Name Cheese1 Cheese2 Cheese3 0 Evan Gouda NaN NaN 1 John Cheddar Havarti Blue 2 Evan Ch
R vs python中的ACF置信区间：为什么不同？2019-10-26 13:55:51

当我在R中使用acf函数时,它会绘制水平线,这些水平线表示在各种滞后下自相关的置信区间(默认为95％)：但是,当我在python中使用statsmodels.graphics.tsaplots.plot_acf时,基于更复杂的计算,我会看到弯曲的置信区间：请注意,在R版本中,直到滞后25为止的滞后被认为是重要的.对于相同的数
如何使用逆CDF在Python中随机抽样对数正态数据并指定目标百分位数？2019-10-26 04:55:14

我正在尝试从Python的对数正态分布生成随机样本,该应用程序用于模拟网络流量.我想生成这样的样本： >模态采样结果为320(〜10 ^ 2.5) > 80％的样本位于100到1000(10 ^ 2到10 ^ 3)的范围内我的策略是使用逆CDF(或我相信的Smirnov变换)： >将PDF用于以2.5为中心的正态分布,以计算10 ^ x的P
Python：如何从非标准的柯西分布中随机采样,从而使用不同的参数？2019-10-25 21:58:42

我在看这里：numpy 我可以看到您可以使用指定数组的命令np.random.standard_cauchy()从标准的Cauchy中采样. 我需要从可能具有x_0！= 0和gamma！= 1的柯西(Cauchy)进行采样,即可能不在原点上,也没有标度等于1. 我怎样才能做到这一点？解决方法:如果您有秘密,可以使用scipy.stats.cauchy,它

首页 < 2 3 4 5 6 7 8 > 尾页

ICode9

如何计算几个目标的转化率的统计显着性？2019-12-02 03:59:07

python-熊猫：通过直方图结果索引数据2019-12-01 13:57:42

python-分组的熊猫DataFrames：如何将scipy.stats.sem应用于它们？2019-12-01 04:06:15

Python-最小化卡方2019-11-22 02:06:12

为何scipy.stats.mstats.pearsonr结果与scipy.stats.pearsonr不一致？2019-11-21 19:05:44

似然比测试statsmodels2019-11-21 18:06:48

在Python中使用P值进行F检验2019-11-20 20:57:36

Python：带有2个样本的二维Kolmogorov-Smirnov2019-11-20 13:58:03

CodeGo.net>如何获得执行多次bernoulli实验的详细结果(概率树)2019-11-11 19:16:24

人口均衡的分层随机抽样2019-11-10 19:06:50

python-使用pandas数据框和约束最小化距离(K​​nn)2019-11-08 10:59:17

PHP和MySQL统计系统2019-11-05 23:15:13

基于MySQL和PHP的统计信息2019-11-05 14:31:31

java-如何使用JDBC访问Oracle表统计信息,特别是NUM_ROWS和AVG_ROW_LEN？2019-11-02 14:00:34

php函数get_browser有多可靠？2019-11-02 13:30:35

是否有用于训练对数线性模型的python软件包？2019-10-31 00:59:42

python-计算高斯的标准偏差2019-10-29 18:57:14

可以在Scipy中的Mann-Whitney U检验中指定替代假设吗？2019-10-29 09:56:22

python-创建具有左偏斜概率分布的随机数2019-10-29 09:55:24

python-一种对集合进行分区以从子集中获取最小方差总和的策略2019-10-29 00:56:35

python-如何在scikit-learn中使用SGDRegressor2019-10-28 09:07:19

python-熊猫多个列中最常见的值2019-10-26 21:56:30

R vs python中的ACF置信区间：为什么不同？2019-10-26 13:55:51

如何使用逆CDF在Python中随机抽样对数正态数据并指定目标百分位数？2019-10-26 04:55:14

Python：如何从非标准的柯西分布中随机采样,从而使用不同的参数？2019-10-25 21:58:42

python-使用pandas数据框和约束最小化距离(Knn)2019-11-08 10:59:17