色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<label id="zhvid"><video id="zhvid"></video></label>

"); //-->

博客專欄

EEPW首頁 > 博客 > 基于自動(dòng)編碼器的賽車視角轉(zhuǎn)換與分割

基于自動(dòng)編碼器的賽車視角轉(zhuǎn)換與分割

發(fā)布人：數(shù)據(jù)派THU 時(shí)間：2022-06-19 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

發(fā)布文章

來源：Deephub Imba

本篇文章將介紹如何將賽道的圖像轉(zhuǎn)換為語義分割后鳥瞰圖的軌跡。

如下所示，輸入圖像為：

輸出：

總結(jié)來說我們的任務(wù)是獲取輸入圖像，即前方軌道的前置攝像頭視圖，并構(gòu)建一個(gè)鳥瞰軌道視圖，而鳥瞰軌道視圖會(huì)分割不同的顏色表示賽道和路面的邊界。
僅僅從輸入圖像中提取出關(guān)于走向的信息是相當(dāng)困難的，因?yàn)槲磥淼脑S多軌道信息被壓縮到圖像的前20個(gè)像素行中。鳥瞰攝像頭能夠以更清晰的格式表達(dá)關(guān)于前方賽道的信息，我們可以更容易地使用它來規(guī)劃汽車的行為。
在正常行駛時(shí)拍攝鳥瞰圖是非常難實(shí)現(xiàn)的，所以如果我們可以使用前置攝像頭的圖像重建這些鳥眼圖像，就能讓我們用更清晰信息來進(jìn)行路徑的規(guī)劃。另一個(gè)好處是可以降低維度，有效地將整個(gè)圖像表示為一組32個(gè)數(shù)字，這比整個(gè)圖像占用的空間少得多。并且如果還可以使用這種低維數(shù)據(jù)作為強(qiáng)化學(xué)習(xí)算法的觀察空間。
本文中利用一種叫做變分自動(dòng)編碼器(VAEs)的工具來幫助我們完成這項(xiàng)任務(wù)。簡(jiǎn)單地說，我們把圖像壓縮到32維的潛在空間，然后重建我們分割的鳥瞰圖。本文末尾的PyTorch代碼顯示了完整的模型代碼。

為了訓(xùn)練這一點(diǎn)，我們從前置攝像頭和鳥類攝像頭收集了一系列圖像。然后用編碼器進(jìn)行編碼，然后使用全連接的層將維度降低到目標(biāo)大小，最后使用****用一系列反卷積層重建圖像。
結(jié)果如下所示：

雖然我們可以在重建中看到一些噪聲，但它可以很好地捕捉到整體曲線。代碼如下：

import cv2
import tqdm
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F


class BEVVAE(nn.Module):
  """Input should be (bsz, C, H, W) where C=3, H=42, W=144"""

  def __init__(self, im_c=3, im_h=95, im_w=512, z_dim=32):
      super().__init__()

      self.im_c = im_c
      self.im_h = im_h
      self.im_w = im_w

      encoder_list = [
          nn.Conv2d(im_c, 32, kernel_size=4, stride=2, padding=1),
          nn.ReLU(),
          nn.Conv2d(32, 64, kernel_size=4, stride=2, padding=1),
          nn.ReLU(),
          nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1),
          nn.ReLU(),
          nn.Conv2d(128, 256, kernel_size=4, stride=2, padding=1),
          nn.ReLU(),
          nn.Conv2d(256, 512, kernel_size=4, stride=2, padding=1),
          nn.ReLU(),
          nn.Flatten(),
      ]
      self.encoder = nn.Sequential(*encoder_list)
      self.encoder_list = encoder_list
      sample_img = torch.zeros([1, im_c, im_h, im_w])
      em_shape = nn.Sequential(*encoder_list[:-1])(sample_img).shape[1:]
      h_dim = np.prod(em_shape)

      self.fc1 = nn.Linear(h_dim, z_dim)
      self.fc2 = nn.Linear(h_dim, z_dim)
      self.fc3 = nn.Linear(z_dim, h_dim)

      self.decoder = nn.Sequential(
          nn.Unflatten(1, em_shape),
          nn.ConvTranspose2d(
              em_shape[0],
              256,
              kernel_size=4,
              stride=2,
              padding=1,
              output_padding=(1, 0),
          ),
          nn.ReLU(),
          nn.ConvTranspose2d(256, 128, kernel_size=4, stride=2, padding=1, output_padding=(1, 0)),
          nn.ReLU(),
          nn.ConvTranspose2d(128, 64, kernel_size=4, stride=2, padding=1, output_padding=(1, 0)),
          nn.ReLU(),
          nn.ConvTranspose2d(
              64, 32, kernel_size=4, stride=2, padding=1, output_padding=(1, 0)
          ),
          nn.ReLU(),
          nn.ConvTranspose2d(32, im_c, kernel_size=4, stride=2, padding=1, output_padding=(1, 0)),
          nn.Sigmoid(),
      )

  def reparameterize(self, mu, logvar):
      std = logvar.mul(0.5).exp_()
      esp = torch.randn(*mu.size(), device=mu.device)
      z = mu + std * esp
      return z

  def bottleneck(self, h):
      mu, logvar = self.fc1(h), self.fc2(h)
      z = self.reparameterize(mu, logvar)
      return z, mu, logvar

  def representation(self, x):
      return self.bottleneck(self.encoder(x))[0]

  def encode_raw(self, x: np.ndarray, device):
      # assume x is RGB image with shape (bsz, H, W, 3)
      p = np.zeros([x.shape[0], 95, 512, 3], np.float)
      for i in range(x.shape[0]):
          p[i] = x[i][190:285] / 255
      x = p.transpose(0, 3, 1, 2)
      x = torch.as_tensor(x, device=device, dtype=torch.float)
      v = self.representation(x)
      return v, v.detach().cpu().numpy()

  def squish_targets(self, x: np.ndarray) -> np.ndarray:
      # Take in target images and resize them
      p = np.zeros([x.shape[0], 95, 512, 3], np.float)
      for i in range(x.shape[0]):
          p[i] = cv2.resize(x[i], (512, 95)) / 255
      x = p.transpose(0, 3, 1, 2)
      return x

  def encode(self, x):
      h = self.encoder(x)
      z, mu, logvar = self.bottleneck(h)
      return z, mu, logvar

  def decode(self, z):
      z = self.fc3(z)
      return self.decoder(z)

  def forward(self, x):
      # expects (N, C, H, W)
      z, mu, logvar = self.encode(x)
      z = self.decode(z)
      return z, mu, logvar

  def loss(self, bev, recon, mu, logvar, kld_weight=1.0):
      bce = F.binary_cross_entropy(recon, bev, reduction="sum")
      kld = -0.5 * torch.sum(1 + logvar - mu ** 2 - logvar.exp())
      return bce + kld * kld_weight

以上代碼修是從L2R示例代碼進(jìn)行了進(jìn)一步修改，https：//github.com/learn-to-race/l2r

Pytorch中的VAE代碼來自：

https：//github.com/sksq96/pytorch-vae

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

WTC-AI太陽能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

萬家樂JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬家樂 | 2013-01-17

海聯(lián)達(dá)（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統(tǒng)

智能計(jì)算 Meta AI | 2024-07-31

大嘴業(yè)話-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

CSR8670CSR8675智能語音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

Nvidia的CEO談AI的未來：“我們將需要三臺(tái)電腦... 一臺(tái)來創(chuàng)建AI... 一臺(tái)來模擬AI... 一臺(tái)來運(yùn)行AI”

智能計(jì)算 AI | 2024-07-31

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

WTC-AI型太陽能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計(jì)算 AI 智能計(jì)算深圳 | 2024-07-30

如何快速搭建手寫體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫體識(shí)別 | 2022-07-29

AI+機(jī)器視覺成趨勢(shì)，圖文詳解N大應(yīng)用場(chǎng)景

智能計(jì)算安森美 AI 機(jī)器視覺 | 2024-07-31

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

國際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專區(qū)

<thead id="thmsl"><kbd id="thmsl"></kbd></thead>