second_stage.Rmd

---
title: "Second Stage--Community factors associated with local RSV epidemic timing: a spatiotemporal modeling study"
author: "ZHE ZHENG"
date: "6/8/2020"
output: html_document
---
```{r}
# INITIALISE TO LOCAL CONTEXT
rm(list=ls())
setwd("~/OneDrive - Yale University/RSV and Influenza/CAR/20000 iter/data")        # set work directory

# READ DATA from the first stage
#NJ data
njtransmean<- readRDS("transnj.rds")               # phase estimates from the first stage 
varnj<- readRDS("varnj.rds")                       # estimated variations from the first stage
wj<- readRDS("wj.rds")                            # W matrix for spatial proximity model
njcommutematrix <- readRDS("njcommutematrix .rds") # W matrix for commuting model
NJcovariate <- readRDS("NJcovariate.rds")                      # demographic information, including normalized average family size, population density, population size, median income and school districts information

#NY data
nytransmean<- readRDS("transny.rds") 
varny<- readRDS("varny.rds")         
wy<- readRDS("wy.rds")
nycommutematrix <- readRDS("nycommutematrix .rds")
NYcovariate <- readRDS("NYcovariate.rds")      

#CT data
cttransmean<- readRDS("transct.rds") 
varct<- readRDS("varct.rds")        
wc<- readRDS("wc.rds")
CTcovariate <- readRDS("CTcovariate.rds")  
ctcommutematrix <- readRDS("ctcommutematrix .rds")
```

```{r}
#################################################################
#No Spatial Correlation Model
#################################################################
## calculate DIC scores
random.dic <- function(trans,nu2,n.zip,housesize,popden,popsize,income,district,N.district){
  
  library(rjags) # LOAD LIBRARIES USED
  library(coda)
  
  model_string<-"
  model{
  
  for(i in 1:n.zip){
  trans[i] ~ dnorm (tru[i], nu2[i]) 
  # The first stage estimates reflect a true mean and observational errors

  tru[i] ~ dnorm(dmean[i], tau[i])
  # The true mean depends on fixed effects (socio-demographic factors) and spatial random effects

  tau[i]~ dgamma(0.01, 0.01)
  # This model assumes no spatial correlation
  }
  
  
  for(i in 1:n.zip){
  dmean[i]<-beta0+beta1*housesize[i]+beta2*popden[i]+beta3*popsize[i]+beta4*income[i]+re[district[i]]}
  # this equation accounts for household size, population density, population size, SES and school districts
  
  beta0 ~ dnorm (0, 0.0001)
  beta1 ~ dnorm (0, 0.0001)
  beta2 ~ dnorm (0, 0.0001)
  beta3 ~ dnorm (0, 0.0001)
  beta4 ~ dnorm (0, 0.0001)
  
  for(q in 1:N.district){
  re[q] ~ dnorm (0, tau4)
  }
  tau4~ dgamma(0.01, 0.01)
  
  }"

  dataset <- list('trans' = trans,"nu2"=nu2,'housesize'=housesize,"popden"=popden,"popsize"=popsize,"income"=income,'district'=district, 'N.district'=max(district),n.zip=n.zip) # read in corresponding dataset
  
  whole <- jags.model(textConnection(model_string),
                   data=dataset,
                   n.chains=2) # set two chains for convergence diagnostic and dic calculation
  update(whole, 
         n.iter=5000) # burn-in iterations
  
  wholeresult<-coda.samples(whole, variable.names=c("dmean","beta0","beta1","beta2","beta3","beta4","tru","re","tau4"),
                     thin=10,
                     n.iter=20000) # acquire posterior samples
  
  random.dic  <- dic.samples(whole,n.iter=20000,thin=10,type="pD") # calculate dic
  
  return(list(random.dic))
  }

random.dic(trans=njtransmean$trans.nj,nu2=1/varnj$var.nj,n.zip=length(njtransmean$var.nj),housesize = NJcovariate$scalehs,popden = NJcovariate$scalepopden,popsize = NJcovariate$scalepopsize,income=NJcovariate$scaleincome,district = NJcovariate$district) # New Jersey estimate

random.dic(trans=nytransmean$trans.ny,nu2=1/varny$var.ny,n.zip=length(nytransmean$var.ny),housesize = NYcovariate$scalehs,popden = NYcovariate$scalepopden,popsize = NYcovariate$scalepopsize,income=NYcovariate$scaleincome,district = NYcovariate$district) # New York estimate

random.dic(trans=cttransmean$trans.ct,nu2=1/varct$var.ct,n.zip=length(cttransmean$trans.ct),housesize = CTcovariate$scalehs,popden = CTcovariate$scalepopden,popsize = CTcovariate$scalepopsize,income=CTcovariate$scaleincome,district = CTcovariate$district) # Connecticut estimate

## save results
randomwhole <- function(trans,nu2,n.zip,housesize,popden,popsize,income,district,N.district){
  
  library(rjags) # LOAD LIBRARIES USED
  library(coda)
  
  model_string<-"
  model{
  
  for(i in 1:n.zip){
  trans[i] ~ dnorm (tru[i], nu2[i]) 
  # The first stage estimates reflect a true mean and observational errors

  tru[i] ~ dnorm(dmean[i], tau[i])
  # The true mean depends on fixed effects (socio-demographic factors) and spatial random effects

  tau[i]~ dgamma(0.01, 0.01)
  # This model assumes no spatial correlation
  }
  
  
  for(i in 1:n.zip){
  dmean[i]<-beta0+beta1*housesize[i]+beta2*popden[i]+beta3*popsize[i]+beta4*income[i]+re[district[i]]}
  # this equation accounts for household size, population density, population size, SES and school districts
  
  beta0 ~ dnorm (0, 0.0001)
  beta1 ~ dnorm (0, 0.0001)
  beta2 ~ dnorm (0, 0.0001)
  beta3 ~ dnorm (0, 0.0001)
  beta4 ~ dnorm (0, 0.0001)
  
  for(q in 1:N.district){
  re[q] ~ dnorm (0, tau4)
  }
  tau4~ dgamma(0.01, 0.01)
  
  }"

  dataset <- list('trans' = trans,"nu2"=nu2,'housesize'=housesize,"popden"=popden,"popsize"=popsize,"income"=income,'district'=district, 'N.district'=max(district),n.zip=n.zip) # read in corresponding dataset
  
  whole <- jags.model(textConnection(model_string),
                   data=dataset,
                   n.chains=2) # set two chains for convergence diagnostic and dic calculation
  update(whole, 
         n.iter=5000) # burn-in iterations
  
  wholeresult<-coda.samples(whole, variable.names=c("dmean","beta0","beta1","beta2","beta3","beta4","tru","re","tau4"),
                     thin=10,
                     n.iter=20000) # acquire posterior samples
 randomresult <<- as.data.frame(as.matrix(wholeresult)) }

randomwhole(trans=njtransmean$trans.nj,nu2=1/varnj$var.nj,n.zip=length(njtransmean$var.nj),housesize = NJcovariate$scalehs,popden = NJcovariate$scalepopden,popsize = NJcovariate$scalepopsize,income=NJcovariate$scaleincome,district = NJcovariate$district) # New Jersey estimate

randomwhole(trans=nytransmean$trans.ny,nu2=1/varny$var.ny,n.zip=length(nytransmean$var.ny),housesize = NYcovariate$scalehs,popden = NYcovariate$scalepopden,popsize = NYcovariate$scalepopsize,income=NYcovariate$scaleincome,district = NYcovariate$district) # New York estimate

randomwhole(trans=cttransmean$trans.ct,nu2=1/varct$var.ct,n.zip=length(cttransmean$trans.ct),housesize = CTcovariate$scalehs,popden = CTcovariate$scalepopden,popsize = CTcovariate$scalepopsize,income=CTcovariate$scaleincome,district = CTcovariate$district) # Connecticut estimate
```


```{r}
#################################################################
#Spatial Proximity Model
#################################################################
SP.dic <- function(trans,nu2,n.zip,housesize,popden,popsize,income,district,w.mat,Id.mat){
  
  library(rjags)
  library(coda)
  
  model_string<-"
  model{
  
  for(i in 1:n.zip){
  trans[i] ~ dnorm (tru[i], nu2[i])
  
  }
  tru[1:n.zip] ~ dmnorm(dmean, Leroux)
  # this model assumes nearby locations have similar epidemic timing
  
  for(i in 1:n.zip){
  dmean[i]<-beta0+beta1*housesize[i]+beta2*popden[i]+beta3*popsize[i]+beta4*income[i]+re[district[i]]
  }
  
  beta0 ~ dnorm (0, 0.0001)
  beta1 ~ dnorm (0, 0.0001)
  beta2 ~ dnorm (0, 0.0001)
  beta3 ~ dnorm (0, 0.0001)
  beta4 ~ dnorm (0, 0.0001)
  
  Leroux <- inv.tau*(rho*w.mat + (1 - rho)*Id.mat) # calculate spatial correlated random effects
  inv.tau ~ dgamma(0.01, 0.01)
  rho~ dunif(0,1)
  
  for(q in 1:N.district){
  re[q] ~ dnorm (0, tau4)
  }
  tau4~ dgamma(0.01, 0.01)

#############################################
#calculate variance
#############################################
  randomef <- 1/inv.tau+1/tau4
  
#############################################
#Use to calculate percentage
#############################################
  sch.percent <- (1/tau4)/(1/inv.tau+1/tau4)
  sp.percent <- (1/inv.tau)/(1/inv.tau+1/tau4)

  }"

  dataset <- list('trans' = trans,"nu2"=nu2,'housesize'=housesize,"popden"=popden,"popsize"=popsize,"income"=income,'district'=district, 'N.district'=max(district),n.zip=n.zip,w.mat=w.mat,Id.mat=Id.mat)
  
  whole <- jags.model(textConnection(model_string),
                      data=dataset,
                      n.chains=2)
  
  update(whole, 
         n.iter=5000)
  
  wholeresult<-coda.samples(whole, variable.names=c("beta1","beta0","beta2","tru","rho","beta3","beta4","dmean","sch.percent","sp.percent","randomef"),
                            thin=10,
                            n.iter=20000)
  
  sp.dic  <- dic.samples(whole,n.iter=20000,thin=10,type="pD")
  
  return(sp.dic)
}

SP.dic(trans=njtransmean$trans.nj,nu2=1/varnj$var.nj,n.zip=length(njtransmean$var.nj),housesize = NJcovariate$scalehs,popden = NJcovariate$scalepopden,popsize = NJcovariate$scalepopsize,income=NJcovariate$scaleincome,district = NJcovariate$district,w.mat=wj,Id.mat=diag(ncol(wj))) # New Jersey estimate

SP.dic(trans=cttransmean$trans.ct,nu2=1/varct$var.ct,n.zip=length(cttransmean$trans.ct),housesize = CTcovariate$scalehs,popden = CTcovariate$scalepopden,popsize = CTcovariate$scalepopsize,income=CTcovariate$scaleincome,district = CTcovariate$district,w.mat=wc,Id.mat=diag(nrow(wc))) # Connecticut estimate

SP.dic(trans=nytransmean$trans.ny,nu2=1/varny$var.ny,n.zip=length(nytransmean$var.ny),housesize = NYcovariate$scalehs,popden = NYcovariate$scalepopden,popsize = NYcovariate$scalepopsize,income=NYcovariate$scaleincome,district = NYcovariate$district,w.mat=wy,Id.mat=diag(ncol(wy))) # New York estimate

SP <- function(trans,nu2,n.zip,housesize,popden,popsize,income,district,w.mat,Id.mat){
  
  library(rjags)
  library(coda)
  
  model_string<-"
  model{
  
  for(i in 1:n.zip){
  trans[i] ~ dnorm (tru[i], nu2[i])
  
  }
  tru[1:n.zip] ~ dmnorm(dmean, Leroux)
  # this model assumes nearby locations have similar epidemic timing
  
  for(i in 1:n.zip){
  dmean[i]<-beta0+beta1*housesize[i]+beta2*popden[i]+beta3*popsize[i]+beta4*income[i]+re[district[i]]
  }
  
  beta0 ~ dnorm (0, 0.0001)
  beta1 ~ dnorm (0, 0.0001)
  beta2 ~ dnorm (0, 0.0001)
  beta3 ~ dnorm (0, 0.0001)
  beta4 ~ dnorm (0, 0.0001)
  
  Leroux <- inv.tau*(rho*w.mat + (1 - rho)*Id.mat) # calculate spatial correlated random effects
  inv.tau ~ dgamma(0.01, 0.01)
  rho~ dunif(0,1)
  
  for(q in 1:N.district){
  re[q] ~ dnorm (0, tau4)
  }
  tau4~ dgamma(0.01, 0.01)

#############################################
#calculate variance
#############################################
  randomef <- 1/inv.tau+1/tau4
  
#############################################
#Use to calculate percentage
#############################################
  sch.percent <- (1/tau4)/(1/inv.tau+1/tau4)
  sp.percent <- (1/inv.tau)/(1/inv.tau+1/tau4)

  }"

  dataset <- list('trans' = trans,"nu2"=nu2,'housesize'=housesize,"popden"=popden,"popsize"=popsize,"income"=income,'district'=district, 'N.district'=max(district),n.zip=n.zip,w.mat=w.mat,Id.mat=Id.mat)
  
  whole <- jags.model(textConnection(model_string),
                      data=dataset,
                      n.chains=2)
  
  update(whole, 
         n.iter=5000)
  
  wholeresult<-coda.samples(whole, variable.names=c("beta1","beta0","beta2","tru","rho","beta3","beta4","dmean","sch.percent","sp.percent","randomef"),
                            thin=10,
                            n.iter=20000)
  
  spresult <<- as.data.frame(as.matrix(wholeresult)) 
}

SP(trans=njtransmean$trans.nj,nu2=1/varnj$var.nj,n.zip=length(njtransmean$var.nj),housesize = NJcovariate$scalehs,popden = NJcovariate$scalepopden,popsize = NJcovariate$scalepopsize,income=NJcovariate$scaleincome,district = NJcovariate$district,w.mat=wj,Id.mat=diag(ncol(wj))) # New Jersey estimate

SP(trans=cttransmean$trans.ct,nu2=1/varct$var.ct,n.zip=length(cttransmean$trans.ct),housesize = CTcovariate$scalehs,popden = CTcovariate$scalepopden,popsize = CTcovariate$scalepopsize,income=CTcovariate$scaleincome,district = CTcovariate$district,w.mat=wc,Id.mat=diag(nrow(wc))) # Connecticut estimate

SP(trans=nytransmean$trans.ny,nu2=1/varny$var.ny,n.zip=length(nytransmean$var.ny),housesize = NYcovariate$scalehs,popden = NYcovariate$scalepopden,popsize = NYcovariate$scalepopsize,income=NYcovariate$scaleincome,district = NYcovariate$district,w.mat=wy,Id.mat=diag(ncol(wy))) # New York estimate
```

```{r}
#################################################################
#Commuting Flows Model
#################################################################
com.dic <- function(trans,nu2,n.zip,housesize,population,district,w.mat,Id.mat,N.district){
  
  library(rjags)
  library(coda)
  
  model_string<-"
  model{
  
  for(i in 1:n.zip){
  trans[i] ~ dnorm (tru[i], nu2[i])
  
  }
  tru[1:n.zip] ~ dmnorm(dmean, Leroux[1:n.zip,1:n.zip])
  # this model assumes commuting networks help to seed RSV epidemics   

  for(i in 1:n.zip){
  dmean[i]<-beta0+beta1*housesize[i]+beta2*popden[i]+beta3*popsize[i]+beta4*income[i]+re[district[i]]}
  
  beta0 ~ dnorm (0, 0.0001)
  beta1 ~ dnorm (0, 0.0001)
  beta2 ~ dnorm (0, 0.0001)
  beta3 ~ dnorm (0, 0.0001)
  beta4 ~ dnorm (0, 0.0001)
  
  Leroux <- inv.tau*(rho*w.mat + (1 - rho)*Id.mat)
  inv.tau ~ dgamma(1.00, 0.01)
  rho~ dunif(0,1)

  for(q in 1:N.district){
  re[q] ~ dnorm (0, tau4)
  }
  tau4~ dgamma(0.01, 0.01)
  }"

  dataset <- list('trans' = trans,"nu2"=nu2,'housesize'=housesize,"popden"=popden,"popsize"=popsize,"income"=income,'district'=district, 'N.district'=max(district),n.zip=n.zip,w.mat=w.mat,Id.mat=Id.mat)
  
  whole <- jags.model(textConnection(model_string),
                   data=dataset,
                   n.chains=2)
  update(whole, 
         n.iter=5000)
  
  wholeresult<-coda.samples(whole, variable.names=c("beta1","beta0","beta2","tru","rho","re","beta3","beta4","dmean","SSE.ref","theta","sch.percent","sp.percent","randomef"),
                     thin=10,
                     n.iter=20000)
  
  com.dic  <- dic.samples(whole,n.iter=20000,thin=10,type="pD")
  
  return(com.dic)
}

com.dic(trans=njtransmean$trans.nj,nu2=1/varnj$var.nj,n.zip=length(njtransmean$var.nj),housesize = NJcovariate$scalehs,popden = NJcovariate$scalepopden,popsize = NJcovariate$scalepopsize,income=NJcovariate$scaleincome,district = NJcovariate$district,w.mat=njcommutematrix,Id.mat=diag(ncol(njcommutematrix)))

com.dic(trans=nytransmean$trans.ny,nu2=1/varny$var.ny,n.zip=length(nytransmean$var.ny),housesize = NYcovariate$scalehs,popden = NYcovariate$scalepopden,popsize = NYcovariate$scalepopsize,income=NYcovariate$scaleincome,district = NYcovariate$district,w.mat=nycommutematrix,Id.mat=diag(ncol(nycommutematrix)))

com.dic(trans=cttransmean$trans.ct,nu2=1/varct$var.ct,n.zip=length(cttransmean$trans.ct),housesize = CTcovariate$scalehs,popden = CTcovariate$scalepopden,popsize = CTcovariate$scalepopsize,income=CTcovariate$scaleincome,district = CTcovariate$district,w.mat=ctcommutematrix,Id.mat=diag(ncol(ctcommutematrix)))

com <- function(trans,nu2,n.zip,housesize,population,district,w.mat,Id.mat,N.district){
  
  library(rjags)
  library(coda)
  
  model_string<-"
  model{
  
  for(i in 1:n.zip){
  trans[i] ~ dnorm (tru[i], nu2[i])
  
  }
  tru[1:n.zip] ~ dmnorm(dmean, Leroux[1:n.zip,1:n.zip])
  # this model assumes commuting networks help to seed RSV epidemics   

  for(i in 1:n.zip){
  dmean[i]<-beta0+beta1*housesize[i]+beta2*popden[i]+beta3*popsize[i]+beta4*income[i]+re[district[i]]}
  
  beta0 ~ dnorm (0, 0.0001)
  beta1 ~ dnorm (0, 0.0001)
  beta2 ~ dnorm (0, 0.0001)
  beta3 ~ dnorm (0, 0.0001)
  beta4 ~ dnorm (0, 0.0001)
  
  Leroux <- inv.tau*(rho*w.mat + (1 - rho)*Id.mat)
  inv.tau ~ dgamma(1.00, 0.01)
  rho~ dunif(0,1)

  for(q in 1:N.district){
  re[q] ~ dnorm (0, tau4)
  }
  tau4~ dgamma(0.01, 0.01)
  }"

  dataset <- list('trans' = trans,"nu2"=nu2,'housesize'=housesize,"popden"=popden,"popsize"=popsize,"income"=income,'district'=district, 'N.district'=max(district),n.zip=n.zip,w.mat=w.mat,Id.mat=Id.mat)
  
  whole <- jags.model(textConnection(model_string),
                   data=dataset,
                   n.chains=2)
  update(whole, 
         n.iter=5000)
  
  wholeresult<-coda.samples(whole, variable.names=c("beta1","beta0","beta2","tru","rho","re","beta3","beta4","dmean","SSE.ref","theta","sch.percent","sp.percent","randomef"),
                     thin=10,
                     n.iter=20000)
  
  comresult <<- as.data.frame(as.matrix(wholeresult)) 

}

com(trans=njtransmean$trans.nj,nu2=1/varnj$var.nj,n.zip=length(njtransmean$var.nj),housesize = NJcovariate$scalehs,popden = NJcovariate$scalepopden,popsize = NJcovariate$scalepopsize,income=NJcovariate$scaleincome,district = NJcovariate$district,w.mat=njcommutematrix,Id.mat=diag(ncol(njcommutematrix)))

com(trans=nytransmean$trans.ny,nu2=1/varny$var.ny,n.zip=length(nytransmean$var.ny),housesize = NYcovariate$scalehs,popden = NYcovariate$scalepopden,popsize = NYcovariate$scalepopsize,income=NYcovariate$scaleincome,district = NYcovariate$district,w.mat=nycommutematrix,Id.mat=diag(ncol(nycommutematrix)))

com(trans=cttransmean$trans.ct,nu2=1/varct$var.ct,n.zip=length(cttransmean$trans.ct),housesize = CTcovariate$scalehs,popden = CTcovariate$scalepopden,popsize = CTcovariate$scalepopsize,income=CTcovariate$scaleincome,district = CTcovariate$district,w.mat=ctcommutematrix,Id.mat=diag(ncol(ctcommutematrix)))

```

```{r}
#######################################################
#calculate the relative importance of covariates
#######################################################
  
dmean.nj <- spresult[,grep("dmean[",colnames(spresult),fixed = T)] # get posterior estimates
beta0 <- spresult[,grep("beta0[",colnames(spresult),fixed = T)]
beta1 <- spresult[,grep("beta1[",colnames(spresult),fixed = T)]
beta2 <- spresult[,grep("beta2[",colnames(spresult),fixed = T)]
beta3 <- spresult[,grep("beta3[",colnames(spresult),fixed = T)]
beta4 <- spresult[,grep("beta4[",colnames(spresult),fixed = T)]

betasq.hz <- c() #relative importance of family size
betasq.popden <- c()#relative importance of population density
betasq.popsize <- c()#relative importance of population size
betasq.income <- c()#relative importance of median income

for (i in 1:4000) {
  betasq.hz[i] <- (beta1[i]*sd(NJcovariate$scalehs)/sd(dmean.nj[i,]))^2 #relative importance of family size
  betasq.popden[i] <- (beta2[i]*sd(NJcovariate$scalepopden)/sd(dmean.nj[i,]))^2 #relative importance of population density
  betasq.popsize[i] <- (beta3[i]*sd(NJcovariate$scalepopsize)/sd(dmean.nj[i,]))^2 #relative importance of population size
  betasq.income[i] <- (beta4[i]*sd(NJcovariate$scaleincome)/sd(dmean.nj[i,]))^2 #relative importance of median income
}

```

```{r}
##########################################################################################
#calculate difference in epidemic timing between the top and bottom decile for variables
##########################################################################################

beta1.nj <- beta1/sd.nj.hs # convert back to unstandardized coefficients
hs.nj.90th <- quantile(NJcovariates$hs,0.9)-mean.nj.hs # get the top dencile of household size
hs.nj.10th <- quantile(NJcovariates$hs,0.1)-mean.nj.hs # get the bottom dencile of household size
beta0.nj <- beta0
  
monthnj90th.hs <- 12*exp(beta0.nj+beta1.nj*hs.nj.90th)/(1+exp(beta0.nj+beta1.nj*hs.nj.90th))
# epidemic timing estimates for the top dencile of household size

monthnj10th.hs <- 12*exp(beta0.nj+beta1.nj*hs.nj.10th)/(1+exp(beta0.nj+beta1.nj*hs.nj.10th))
# epidemic timing estimates for the bottom dencile of household size

mean(monthnj90th.hs-monthnj10th.hs) # the mean difference in epidemic timing
quantile(monthnj90th.hs-monthnj10th.hs,c(0.025,0.975)) # the 95% CrI of difference in epidemic timing

```


```{r}
#############################################
#calculate variance without fixed effects
#############################################
rv <- function(trans,nu2,n.zip,district,w.mat,Id.mat){
  
  library(rjags)
  library(coda)
  
  model_string<-"
  model{
  
  for(i in 1:n.zip){
  trans[i] ~ dnorm (tru[i], nu2[i])
  
  }
  tru[1:n.zip] ~ dmnorm(dmean, Leroux)
  
  for(i in 1:n.zip){
  dmean[i]<-beta0+re[district[i]]

  phi_leroux[i] <- tru[i]-dmean[i]
  theta[i] <- trans[i]-beta0-re[district[i]]
  }
  
  Leroux <- inv.tau*(rho*w.mat + (1 - rho)*Id.mat)
  inv.tau ~ dgamma(0.01, 0.01)
  rho~ dunif(0,1)
  
  for(q in 1:N.district){
  re[q] ~ dnorm (0, tau4)
  }
  tau4~ dgamma(0.01, 0.01)

#############################################
#calculate variance
#############################################
  randomef <- 1/inv.tau+1/tau4
  
#############################################
#Use to calculate percentage
#############################################
  sch.percent <- (1/tau4)/(1/inv.tau+1/tau4)
  sp.percent <- (1/inv.tau)/(1/inv.tau+1/tau4)

  }"

  dataset <- list('trans' = trans,"nu2"=nu2,'district'=district, 'N.district'=max(district),n.zip=n.zip,w.mat=w.mat,Id.mat=Id.mat)
  
  whole <- jags.model(textConnection(model_string),
                      data=dataset,
                      n.chains=2)
  
  update(whole, 
         n.iter=5000)
  
  wholeresult<-coda.samples(whole, variable.names=c("tru","rho","re","dmean","SSE.ref","theta","sch.percent","sp.percent","randomef"),
                            thin=10,
                            n.iter=20000)
  
  rvresult <- as.data.frame(as.matrix(wholeresult)) 
  
  return(rvresult)
}


rv(trans=njtransmean$trans.nj,nu2=1/varnj$var.nj,n.zip=length(njtransmean$var.nj),district = NJcovariate$district,w.mat=wj,Id.mat=diag(ncol(wj))) # New Jersey estimate

ranef.nj <- rvresult[,grep("randomef",colnames(rvresult),fixed = T)]
fixef.nj <- spresult[,grep("randomef",colnames(spresult),fixed = T)]

#calculate variance reduction
(mean(fixef.nj)-mean(ranef.nj))/mean(ranef.nj) # because it's reduction, this value is negative

```