self.decoder = nn.Sequential(
                nn.Linear(512, 1024),
                nn.ReLU(),
                nn.Linear(1024, 2048),
                nn.ReLU(),
                nn.Linear(2048, 4096),
                nn.ReLU(),
                nn.Linear(4096, self.n_point * 3),
                nn.Tanh(),
                nn.Unflatten(1, (self.n_point, 3)),
                )

vertex_shape_0 = self.mesh_pred.verts_list()[0].shape[0]
# Decoder predicts 3D offsets for each vertex
self.decoder = nn.Sequential(
    nn.Linear(512, 1024),
    nn.BatchNorm1d(1024),
    nn.ReLU(inplace=True),
    nn.Linear(1024, 2048),
    nn.BatchNorm1d(2048),
    nn.ReLU(inplace=True),
    nn.Linear(2048, 4096),
    nn.BatchNorm1d(4096),
    nn.ReLU(inplace=True),
    nn.Linear(4096, 8192),
    nn.BatchNorm1d(8192),
    nn.ReLU(inplace=True),
    nn.Linear(8192, vertex_shape_0 * 3),
    )

self.decoder = nn.Sequential(
                nn.Linear(512, 2 * 2 * 2 * 64),  # Desired shape
                nn.ReLU(),
                nn.Unflatten(1, (64, 2, 2, 2)),  # B x 64 x 2 x 2 x 2
                nn.ConvTranspose3d(
                    in_channels=64, out_channels=32, kernel_size=4, stride=2, padding=1
                ),  # B x 32 x 4 x 4 x 4
                nn.BatchNorm3d(32),
                nn.ReLU(),
                nn.ConvTranspose3d(
                    in_channels=32, out_channels=16, kernel_size=4, stride=2, padding=1
                ),  # B x 16 x 8 x 8 x 8
                nn.BatchNorm3d(16),
                nn.ReLU(),
                nn.ConvTranspose3d(
                    in_channels=16, out_channels=8, kernel_size=4, stride=2, padding=1
                ),  # B x 8 x 16 x 16 x 16
                nn.BatchNorm3d(8),
                nn.ReLU(),
                nn.ConvTranspose3d(
                    in_channels=8, out_channels=1, kernel_size=4, stride=2, padding=1
                ),  # B x 1 x 32 x 32 x32
                nn.BatchNorm3d(1),
                nn.Sigmoid(),  # For probability
            )

def chamfer_loss_helper(point_cloud_src, point_cloud_tgt):
    # Broadcast
    extracted_point_cloud_src = point_cloud_src[:, :, None, :]  # B x N x 1 x 3
    extracted_point_cloud_tgt = point_cloud_tgt[:, None, :, :]  # B x 1 x N x 3

    # Take diff
    diff = extracted_point_cloud_src - extracted_point_cloud_tgt  # B x N x N x 3
    diff = diff**2  # B x N x N x 3

    # sum over last axis
    diff = diff.sum(dim=-1)  # B x N x N

    # minimum
    min_ssd_1 = torch.min(diff, dim=2)  # B x N
    min_ssd_0 = torch.min(diff, dim=1)  # B x N x 1

    # sum across last axis
    summed_squared_diff1 = torch.sum(  # (B, )
        min_ssd_1.values,
        dim=1,
    )
    summed_squared_diff0 = torch.sum(  # B x 1
        min_ssd_0.values,
        dim=1,
    )

    chamfer_distance = summed_squared_diff1 + summed_squared_diff0  # B x 1
    chamfer_distance = chamfer_distance.sum(dim=-1)  # (B,)

    return chamfer_distance

def hausdorff_loss_(point_cloud_src, point_cloud_tgt):
    # Take diff
    diff = (
        point_cloud_src[:, :, None, :] - point_cloud_tgt[:, None, :, :]
    )  # B x N x N x 3
    diff = (diff**2).sum(dim=-1)  # B x N x N

    # Dir ->
    min_values_one, _ = diff.min(dim=2)  # B x N
    max_min_val_one = min_values_one.max(dim=1).values  # B,

    # Dir <-
    min_values_two, _ = diff.min(dim=1)  # B x N
    max_min_val_two = min_values_two.max(dim=1).values  # B,

    # Take max of both direction
    hausdorff_loss = torch.maximum(max_min_val_one, max_min_val_two)  # B,
    hausdorff_loss_mean = hausdorff_loss.mean()

    return hausdorff_loss_mean

def chamfer_loss(point_cloud_src, point_cloud_tgt):
    chamfer_loss_weight = 0.5
    other_loss = 1 - chamfer_loss_weight

    chamfer_loss = chamfer_loss_helper(point_cloud_src, point_cloud_tgt)
    hausdorff_loss = hausdorff_loss_(point_cloud_src, point_cloud_tgt)

    output_loss = chamfer_loss_weight * chamfer_loss + other_loss * hausdorff_loss

    return output_loss